作者: |
发布时间:Wed, 28 Jan 2026 00:00:00 GMT
【东吴证券】半导体行业深度:Agentic AI时代的算力重构
——CPU,从“旁观者”到“总指挥”的价值回归
摘要
随着AI从“对话模型”进化为“行动智能体(Agent)”,计算需求正发生结构性分化。市场长期认为AI算力等同于GPU,而CPU仅负责调度。但在Agent时代,CPU正凭借其在复杂分支预测、高并发调度及大容量内存扩展(CXL)方面的优势,回归算力中心地位,成为执行任务的“总指挥”。
正文
1. 架构重塑:从对话到执行,算力需求由GPU向CPU回归 
- 执行控制流“CPU化”: Agent的本质是“执行任务”,涉及大量
if/else逻辑判断与系统调用(如网页浏览、代码修改)。这类非对称、多分支的任务不适合GPU(易导致算力利用率骤降),却是CPU微架构的传统优势领地。 - 记忆体系“去GPU化”: 长上下文推理产生的巨大KV Cache会迅速耗尽GPU昂贵的HBM容量。使用**CPU搭配大容量DDR5/LPDDR5(通过CXL扩展)**承载KV Cache,已成为兼顾高吞吐与成本效率的主流选择。
2. 性能瓶颈:CPU核心数成为Agent落地的确定性制约 
研究显示,在完整的Agent执行链路中,CPU性能已成为真实瓶颈:
- 高延迟占比: 工具处理环节(检索、Python/Bash执行等)在CPU上消耗的时间占端到端延迟比例最高可达 90.6%。
- 并发压力: 在高并发场景下(Batch Size提升至128),CPU端到端延迟从 2.9秒 飙升至 6.3秒 以上。
- 结论: 系统吞吐受限的重心已从GPU计算力转向CPU的核心数并发调度能力。
3. 产业趋势:超多核CPU与沙盒基础设施加速落地 
- 厂商布局: AWS和Google Cloud正加速建设面向Agent的沙盒环境(Sandbox),强化隔离与编排能力。
- 硬件演进:
- AMD: 推出的Turin处理器最高可达 192核。
- Intel: Sierra Forest采用纯能效核设计,核心数可达 144甚至288核。
- NVIDIA: 在新架构中主动提升CPU配比,确认了大内存CPU是承载海量KV Cache的最优容器。
结论与投资建议
核心观点:
随着Agent商业化推进,厂商必须持续压低任务执行成本。超多核CPU以更高的并行度、更低的单位功耗,成为支撑大规模Agent运行的核心资源池。
建议关注:
- 海光信息: 受益于Agent驱动下CPU从调度走向高并发执行的地位抬升。
- 澜起科技: 受益于长上下文场景下 CXL驱动 的“存力+算力”协同升级。
- 其他关注: 龙芯中科、万通发展(数渡科技)。
风险提示
- Agent落地节奏不及预期风险;
- 新型硬件架构替代风险;
- CSP(云服务商)资本开支波动风险。
延伸阅读
研报PDF原文链接