[东兴证券]超节点与Scale up网络专题之英伟达:行业标杆,领先优势建立在NVLink和NVLink Switch

:memo: 作者: | :date: 发布时间:Wed, 04 Feb 2026 16:00:00 GMT

:rocket: 超节点与 Scale up 网络专题:英伟达核心竞争优势分析

:pushpin: 投资摘要

随着大语言模型(LLM)从千亿级向万亿级乃至十万亿级演进,跨服务器**张量并行(TP)专家并行(EP)**成为分布式训练与推理的刚需。为应对严苛的带宽与延迟要求,**Scale up 网络(纵向扩张网络)**已成为构建超节点的核心路径。英伟达凭借 NVLinkNVLink Switch 的长期积累,已在超节点领域建立起深厚的护城河。


:magnifying_glass_tilted_left: 正文内容

:one: 三代架构演进:从初步探索到标准化扩张

英伟达在 2024-2026 年间,通过三代架构持续推高超节点性能:

  • Hopper 架构 (GH200): 开启了 Scale up 的初步探索。利用 NVLink 和 NVLink-C2C 技术,实现了 GPU 与 CPU 内存的统一编址,让每个 GPU 均可访问集群内的所有内存资源。
  • Blackwell 架构 (GB200): 推动了方案的标准化。GB200 NVL72 将规模稳定在 72 个 GPU/机柜。该方案由 18 个计算托架(Compute Tray)和 9 个交换托架(Switch Tray)组成,通过“NVLink5 私有协议+铜线缆”实现了 130TB/s 的全连接双向总带宽。
  • Rubin 架构 (VR200): 带宽实现倍增。预计 2026 年发布,其 NVLink6 技术将单 GPU 互连带宽由 1.8TB/s 提升至 3.6TB/s。Spectrum-6 交换机将引入 **CPO(共封装光学)**技术,大幅提升能效。

:two: 核心护城河:NVLink 与 NVSwitch

英伟达超节点的领先优势根植于其私有的通信协议与芯片:

  • 技术组合: 引入了网状拓扑、差分信号传输、流量调度信用机制及多 Lane 绑定等先进技术。
  • 互联规模: 2025 年 NVLink5 已支持 72 GPU 的全互联通信。
  • 未来突破: 计划推出 Vera Rubin NVL144Rubin Ultra NVL576,互联规模将由 72 颗飙升至 576 颗 GPU。届时将引入 NVLink Switch Blade(交换机刀片),利用 PCB 中板替代传统 5000+ 根有源铜缆,展现极强的工程创新力。

:three: 行业趋势与潜在挑战

  • 市场预测: 大摩预计 2025 年英伟达 GB200/300 NVL72 出货量约 2800 台
  • 技术博弈: AI 产业正探索降低 TP 与 EP 规模的替代方案,这可能限制 Scale up 网络的增长空间。
  • 未来路径: Scale up(纵向)与 Scale out(横向)网络的融合将成为英伟达保持领先的新趋势。

:light_bulb: 结论与投资建议

:building_construction: 竞争格局

自 2025 年起,AI 芯片厂商的竞争已从单一算力性能延伸至**“芯片 + Scale up 网络”**的综合体。尽管英伟达目前处于领先地位,但微软、Meta、华为、中科曙光、中兴通讯、新华三等全球及国内厂商均在积极布局。

:chart_increasing: 重点关注方向

  1. 英伟达供应链: 关注 PCB 背板、高速铜缆、光模块、供电与液冷系统等核心环节。
  2. 国产替代机会: 关注发布国产超节点的云厂商、电信设备商及 AI 芯片厂商。
  3. 核心设备: 交换机及交换机芯片是网络互联的关键,建议关注相关供应商。

:warning: 风险提示

  1. LLM 训练与推理技术路径发生重大变化;
  2. 超节点互联方案存在工程不确定性;
  3. 英伟达超节点实际出货量不及预期;
  4. 下游 AI 应用端需求增长缓慢。

:light_bulb: 延伸阅读
研报PDF原文链接