[国金证券]计算机行业周报:DeepSeek V4发布,国产算力加速

:memo: 作者: | :date: 发布时间:Sat, 25 Apr 2026 16:00:00 GMT

:rocket: [国金证券] 计算机行业周报:DeepSeek V4重磅发布,国产算力开启百万上下文普惠时代

:pushpin: 摘要

2026年4月24日,DeepSeek正式发布并开源 DeepSeek-V4预览版,同步推出完整技术报告。本次发布涵盖 DeepSeek-V4-ProDeepSeek-V4-Flash 两个版本:

  • V4-Pro:具备 1.6万亿 总参数(49B激活参数)。
  • V4-Flash:具备 2840亿 总参数(13B激活参数)。

该系列模型通过架构创新,成功将最大上下文长度提升至 100万 Token,实现了计算与内存成本的跨越式下降。其中,V4-Pro-Max在 Agent能力、世界知识、推理性能 上已接近世界顶级闭源模型水平。官方预告,随着下半年 昇腾950超节点 批量上市,推理价格将大幅下调,正式开启技术普惠时代。


:magnifying_glass_tilted_left: 正文

1. 架构革新赋能效率跃升——全链路创新体系 :gear:

DeepSeek-V4的高效能源于从算法到底层基建的深度优化:

  • 算法层面:创新性地采用 CSA(交叉空间注意力)与 HCA(混合通道注意力) 融合机制,配合 流形约束超连接(mHC)Muon优化器。这些技术不仅提升了长上下文的运算效率,还显著加快了训练收敛速度。
  • 底层基建:通过 MoE模块一体化融合内核、领域专用语言 TileLang 以及 FP4量化感知训练,实现了计算、通信与内存访问的高效协同。
  • 效率突破:在百万Token场景下,单Token推理 FLOPsKVCache占用 较前代V3.2大幅下降,为长文本应用的商业化普及扫清了障碍。

2. 国产算力协同适配——Day0双首发实现自主可控 :shield:

DeepSeek-V4发布当日即实现与国产顶级芯片的 Day0适配,标志着国产大模型与国产算力的深度共振:

  • 寒武纪:基于 vLLM推理框架 完成适配并开源代码。通过自研融合算子库与高性能编程语言,深度释放了硬件的推理潜能。
  • 华为昇腾:昇腾超节点全系列产品全面支持。昇腾950 通过融合kernel及多流并行技术,实现了 高吞吐、低时延 的部署性能;昇腾A3 亦完成适配,提供完整的训练参考实现。

这一合作模式极大推动了国内大模型软硬件产业的协同,对于构建 AI算力自主可控生态 具有里程碑意义。


:light_bulb: 结论与投资建议

:chart_increasing: 重点标的推荐

  • 国内算力寒武纪、海光信息、中科曙光、润泽科技、浪潮信息、华丰科技、神州数码、百度集团、中芯国际、润建股份、云赛智联。
  • 海外算力/存储中际旭创、新易盛、天孚通信、工业富联、胜宏科技、兆易创新、源杰科技、英维克。
  • CPU/半导体海光信息、澜起科技、龙芯中科、中科曙光、中国长城。
  • AI应用层
    1. 大模型&Agent:智谱、科大讯飞、腾讯控股、阿里巴巴。
    2. AI Infra & 高壁垒应用星环科技、中控技术、金蝶国际、德才股份、美年健康、汇量科技、范式智能。

:warning: 风险提示

  1. 行业竞争加剧:全球模型迭代超预期导致竞争压力增大。
  2. 技术研发不及预期:架构创新或软硬适配可能存在不可预见的瓶颈。
  3. 资本开支波动:下游特定行业对AI投入的周期性波动风险。

:light_bulb: 延伸阅读
研报PDF原文链接