AI进入Agent时代,CPU何以站上“算力C位”?

:memo: 作者: 科创板日报 张真| :date: 发布时间:2026-01-31 10:15:31

【标题】

算力权杖位移:AI Agent时代重塑CPU价值逻辑,服务器芯片迎“量价齐升”共振周期

【摘要】

:chart_increasing: 核心观察:随着AI行业步入Agent(智能体)驱动的强化学习时代,算力瓶颈正由GPU向CPU转移。研究显示CPU处理延迟在端到端链路中占比最高达90.6%
:warning: 市场供需:受Agent推理需求激增驱动,英特尔与AMD 2026年全服务器CPU产能已售罄,并计划调价10%-15%
:light_bulb: 投资逻辑:英伟达Rubin架构大幅提升CPU核心数确认了**“大内存CPU承载海量KV Cache”的技术趋势,CPU行业正进入存量升级+国产替代+模型迭代**的三重受益期。

【正文】

1. 算力“木桶”补短板:Agent执行链路CPU成核心约束
在Agentic场景中,系统吞吐受限的矛盾已由GPU计算能力转向CPU的核心数并发调度

  • 延迟瓶颈:在高并发场景下,CPU端到端延迟已从2.9秒跃升至6.3秒以上
  • 任务转型:Agent使AI由“纯对话”转向“任务执行”,产生大量分支类(if/else)判断任务。此类任务若由GPU执行会导致利用率骤降,而CPU的微架构天然契合此类高频调度与逻辑控制。

2. 架构范式演进:从“对话”到“执行”的枢纽地位

  • KV Cache Offload技术:长上下文推理极易耗尽GPU的HBM容量。业界主流方案已转向利用CPU搭配大容量DDR5/LPDDR5承载KV Cache与部分参数,CPU正式成为海量数据的最优容器
  • 英伟达战略转向:英伟达追加20亿美元认购CoreWeave,旨在部署专为代理式推理设计的Vera CPU。其下一代Rubin架构亦计划大幅提升CPU核心数,并开放对x86 CPU的支持,变相确认了CPU在AI工厂中的权重提升。

3. 供需极端失衡:2026年全球产能告罄与涨价潮
由于超大规模云服务商(Hyperscalers)暴力扫货,服务器CPU市场出现严重供需错配:

  • 价格调整:英特尔与AMD已计划将2026年服务器CPU价格上调10-15%
  • 产能倾斜:英特尔已将产能紧急转向服务器端,甚至导致消费电子端交付受阻。CEO陈立武在2025年Q4财报会上公开表示,当前半导体需求已超出供应能力。

4. 产业链边际变化:国产替代与生态重构

  • 量能预测:国海证券预计,受超大规模数据中心升级周期驱动,2026年服务器CPU出货量有望增长25%
  • 自主可控:随着国内AI全产业链自主可控的推进,硬件端与软件端的生态适配正加速跟进,国内CPU合作商及国产替代领军企业将直接受益于此次涨价行情与需求爆发。

【结论】

:light_bulb: 投资建议
AI Agent的爆发彻底改变了服务器的算力比例分配,CPU已从传统的“冷板凳”重回算力C位

  1. 短期关注:拥有海外CPU巨头代理权或紧密合作关系的供应链企业,将直接受益于10%-15%的涨价弹性
  2. 中期关注:受益于KV Cache容量需求带动的DDR5、LPDDR5存储配套升级厂商。
  3. 长期逻辑:在**“存量升级+国产替代+模型迭代”**三重共振下,国产服务器CPU及配套生态正迎来估值重塑的历史性机遇。

:warning: 风险提示:模型算法迭代路径变动;宏观经济波动影响资本开支;国产替代进度不及预期。

:light_bulb: 延伸阅读
原文链接

  1. KV Cache Offload 技术:长上下文推理耗尽 GPU HBM 容量,主流方案转向 CPU+DDR5。
  2. 市场供需:英特尔与 AMD 2026 年服务器 CPU 产能售罄,计划调价 10%-15%。
  3. 任务转型:Agent 产生大量分支类(if/else)判断任务,CPU 微架构更契合此类调度。
  4. 英伟达动态:Rubin 架构计划提升 CPU 核心数并开放对 x86 CPU 的支持。