作者: |
发布时间:Wed, 04 Feb 2026 16:00:00 GMT
超节点与 Scale up 网络专题:英伟达核心竞争优势分析
投资摘要
随着大语言模型(LLM)从千亿级向万亿级乃至十万亿级演进,跨服务器**张量并行(TP)与专家并行(EP)**成为分布式训练与推理的刚需。为应对严苛的带宽与延迟要求,**Scale up 网络(纵向扩张网络)**已成为构建超节点的核心路径。英伟达凭借 NVLink 和 NVLink Switch 的长期积累,已在超节点领域建立起深厚的护城河。
正文内容
三代架构演进:从初步探索到标准化扩张
英伟达在 2024-2026 年间,通过三代架构持续推高超节点性能:
- Hopper 架构 (GH200): 开启了 Scale up 的初步探索。利用 NVLink 和 NVLink-C2C 技术,实现了 GPU 与 CPU 内存的统一编址,让每个 GPU 均可访问集群内的所有内存资源。
- Blackwell 架构 (GB200): 推动了方案的标准化。GB200 NVL72 将规模稳定在 72 个 GPU/机柜。该方案由 18 个计算托架(Compute Tray)和 9 个交换托架(Switch Tray)组成,通过“NVLink5 私有协议+铜线缆”实现了 130TB/s 的全连接双向总带宽。
- Rubin 架构 (VR200): 带宽实现倍增。预计 2026 年发布,其 NVLink6 技术将单 GPU 互连带宽由 1.8TB/s 提升至 3.6TB/s。Spectrum-6 交换机将引入 **CPO(共封装光学)**技术,大幅提升能效。
核心护城河:NVLink 与 NVSwitch
英伟达超节点的领先优势根植于其私有的通信协议与芯片:
- 技术组合: 引入了网状拓扑、差分信号传输、流量调度信用机制及多 Lane 绑定等先进技术。
- 互联规模: 2025 年 NVLink5 已支持 72 GPU 的全互联通信。
- 未来突破: 计划推出 Vera Rubin NVL144 和 Rubin Ultra NVL576,互联规模将由 72 颗飙升至 576 颗 GPU。届时将引入 NVLink Switch Blade(交换机刀片),利用 PCB 中板替代传统 5000+ 根有源铜缆,展现极强的工程创新力。
行业趋势与潜在挑战
- 市场预测: 大摩预计 2025 年英伟达 GB200/300 NVL72 出货量约 2800 台。
- 技术博弈: AI 产业正探索降低 TP 与 EP 规模的替代方案,这可能限制 Scale up 网络的增长空间。
- 未来路径: Scale up(纵向)与 Scale out(横向)网络的融合将成为英伟达保持领先的新趋势。
结论与投资建议
竞争格局
自 2025 年起,AI 芯片厂商的竞争已从单一算力性能延伸至**“芯片 + Scale up 网络”**的综合体。尽管英伟达目前处于领先地位,但微软、Meta、华为、中科曙光、中兴通讯、新华三等全球及国内厂商均在积极布局。
重点关注方向
- 英伟达供应链: 关注 PCB 背板、高速铜缆、光模块、供电与液冷系统等核心环节。
- 国产替代机会: 关注发布国产超节点的云厂商、电信设备商及 AI 芯片厂商。
- 核心设备: 交换机及交换机芯片是网络互联的关键,建议关注相关供应商。
风险提示
- LLM 训练与推理技术路径发生重大变化;
- 超节点互联方案存在工程不确定性;
- 英伟达超节点实际出货量不及预期;
- 下游 AI 应用端需求增长缓慢。
延伸阅读
研报PDF原文链接