作者: |
发布时间:Mon, 02 Mar 2026 16:00:00 GMT
[东兴证券] 通信行业深度报告:超节点与Scale-up网络——多极化格局开启,打破英伟达独大局面
【摘要】 
超节点与Scale-up网络是突破算力与通信瓶颈、支撑万亿级大模型与高实时性应用的关键基础设施。本报告深入分析了英伟达、谷歌、AMD、华为四大算力芯片巨头的布局。
- 核心趋势: 行业正处于快速发展期,将带动PCB、交换芯片、光器件、高速铜缆、存储及供电散热等部件的技术革新。
- 市场预判: 英伟达虽领先,但随着谷歌OCS、AMD UALink及国产算力的发力,市场正向“一超多强”演变。
【正文】
1. 英伟达(NVIDIA):凭借NVLink统治超节点生态 
英伟达的领先优势深深扎根于其私有的NVLink和NVLink Switch技术。
- 产品规划: 2024-2025年主推GB200/GB300 NVL72,预计2025年出货量约 2,800台。2026-2027年将推出Vera Rubin NVL144/576,互联GPU数量将从72颗飙升至 576颗。
- 工程创新: 新一代Kyber机架将引入NVLink交换机刀片,利用PCB中板替代传统 5,000+根 有源铜缆。
- 性能指标: NVLink5实现单GPU带宽 1,800GB/s,总双向带宽达 130TB/s;未来NVSwitch Gen6/7带宽将进一步升级至 3.6TB/s。
- 挑战: 随着AI产业探索降低并行规模(TP/EP),Scale-up网络的上限可能受限,英伟达正致力于推动Scale-up与Scale-out网络的融合。
2. 华为:集群化策略与灵衢协议的追赶 
华为通过大规模集群化设计,在性能参数上展现出挑战英伟达的潜力。
- 性能赶超: 预计2026 Q4发布的Atlas 950超节点,总算力达 8 EFLOPS (FP8),显著高于英伟达NVL144的 2.52 EFLOPS;内存容量达 1,152TB,互联带宽达 16.3PB/s。
- 架构调整: 放弃全光互联,转向**“柜内正交铜互联+柜间光互联”**的混合设计,旨在平衡高可靠性与总体拥有成本(TCO)。
- 生态建设: 华为灵衢协议正转向开放。同时,国内正由工信部牵头推动CLink协议,旨在统一标准,打破各厂商间的生态壁垒。
3. 谷歌(Google):OCS光交换技术的独行者 
谷歌在Scale-up网络中另辟蹊径,大规模商用光电路交换机(OCS),构筑了深厚的技术护城河。
- 技术路线: 2026年Anthropic将部署近 100万颗 TPU v7芯片;2027年推第8代TPU对标英伟达Rubin。
- OCS优势: 相比电交换,OCS能耗降低数个数量级,时延极小,且能跨代复用光模块。
- 三大核心件: 谷歌自主研发了MEMS微反射镜(Palomar OCS核心)、波分复用模块及光环形器,有效解决了大规模部署中的损耗与成本问题。
4. AMD:UALink开放标准的强力挑战者 
AMD联合业界巨头推动UALink开放标准,旨在通过生态力量对抗英伟达的封闭协议。
- 标准进度: UALink 1.0规范于2025年发布,预计2027年迎来爆发,成员单位已超过 100家。
- 标杆产品: Helios机架采用双宽设计,其 MI455x 系列在算力、内存和功耗控制上表现出色。
- 竞争优势: 对比GB200 NVL72,Helios在功耗效率上具备显著优势,且预留了扩展至144 GPU的空间。
【结论与建议】 
1. 行业结论:
- 竞争升维: AI算力竞争已从“单芯片性能”演进为**“芯片+Scale-up网络”**的系统级竞争。
- 价值重估: 2025年英伟达股价涨幅(38%)已显著落后于谷歌、AMD及国内算力指数,市场正进入国产超节点与非尼生态的价值重估期。
2. 投资建议:
关注整机厂商: 看好谷歌、AMD以及国内具备超节点研发实力的头部厂商。
关注核心供应链: 重点关注PCB背板、高速铜缆、光模块、供电与液冷系统。
关注底层技术: 布局谷歌OCS核心零部件供应商,以及UALink标准下的交换芯片研发商。
3. 风险提示: ![]()
- 大模型(LLM)训练/推理路径发生重大变化;
- 超节点功耗与性能平衡难度超出预期;
- 供应链波动导致出货量不及预期;
- 下游AI应用增长乏力。
延伸阅读
研报PDF原文链接