作者: 科创板日报 张真|
发布时间:2026-01-31 10:15:31
【标题】
算力权杖位移:AI Agent时代重塑CPU价值逻辑,服务器芯片迎“量价齐升”共振周期
【摘要】
核心观察:随着AI行业步入Agent(智能体)驱动的强化学习时代,算力瓶颈正由GPU向CPU转移。研究显示CPU处理延迟在端到端链路中占比最高达90.6%。
市场供需:受Agent推理需求激增驱动,英特尔与AMD 2026年全服务器CPU产能已售罄,并计划调价10%-15%。
投资逻辑:英伟达Rubin架构大幅提升CPU核心数确认了**“大内存CPU承载海量KV Cache”的技术趋势,CPU行业正进入存量升级+国产替代+模型迭代**的三重受益期。
【正文】
1. 算力“木桶”补短板:Agent执行链路CPU成核心约束
在Agentic场景中,系统吞吐受限的矛盾已由GPU计算能力转向CPU的核心数并发调度。
- 延迟瓶颈:在高并发场景下,CPU端到端延迟已从2.9秒跃升至6.3秒以上。
- 任务转型:Agent使AI由“纯对话”转向“任务执行”,产生大量分支类(if/else)判断任务。此类任务若由GPU执行会导致利用率骤降,而CPU的微架构天然契合此类高频调度与逻辑控制。
2. 架构范式演进:从“对话”到“执行”的枢纽地位
- KV Cache Offload技术:长上下文推理极易耗尽GPU的HBM容量。业界主流方案已转向利用CPU搭配大容量DDR5/LPDDR5承载KV Cache与部分参数,CPU正式成为海量数据的最优容器。
- 英伟达战略转向:英伟达追加20亿美元认购CoreWeave,旨在部署专为代理式推理设计的Vera CPU。其下一代Rubin架构亦计划大幅提升CPU核心数,并开放对x86 CPU的支持,变相确认了CPU在AI工厂中的权重提升。
3. 供需极端失衡:2026年全球产能告罄与涨价潮
由于超大规模云服务商(Hyperscalers)暴力扫货,服务器CPU市场出现严重供需错配:
- 价格调整:英特尔与AMD已计划将2026年服务器CPU价格上调10-15%。
- 产能倾斜:英特尔已将产能紧急转向服务器端,甚至导致消费电子端交付受阻。CEO陈立武在2025年Q4财报会上公开表示,当前半导体需求已超出供应能力。
4. 产业链边际变化:国产替代与生态重构
- 量能预测:国海证券预计,受超大规模数据中心升级周期驱动,2026年服务器CPU出货量有望增长25%。
- 自主可控:随着国内AI全产业链自主可控的推进,硬件端与软件端的生态适配正加速跟进,国内CPU合作商及国产替代领军企业将直接受益于此次涨价行情与需求爆发。
【结论】
投资建议:
AI Agent的爆发彻底改变了服务器的算力比例分配,CPU已从传统的“冷板凳”重回算力C位。
- 短期关注:拥有海外CPU巨头代理权或紧密合作关系的供应链企业,将直接受益于10%-15%的涨价弹性。
- 中期关注:受益于KV Cache容量需求带动的DDR5、LPDDR5存储配套升级厂商。
- 长期逻辑:在**“存量升级+国产替代+模型迭代”**三重共振下,国产服务器CPU及配套生态正迎来估值重塑的历史性机遇。
风险提示:模型算法迭代路径变动;宏观经济波动影响资本开支;国产替代进度不及预期。
延伸阅读
原文链接