作者: |
发布时间:Sat, 25 Apr 2026 16:00:00 GMT
[国金证券] 计算机行业周报:DeepSeek V4重磅发布,国产算力开启百万上下文普惠时代
摘要
2026年4月24日,DeepSeek正式发布并开源 DeepSeek-V4预览版,同步推出完整技术报告。本次发布涵盖 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两个版本:
- V4-Pro:具备 1.6万亿 总参数(49B激活参数)。
- V4-Flash:具备 2840亿 总参数(13B激活参数)。
该系列模型通过架构创新,成功将最大上下文长度提升至 100万 Token,实现了计算与内存成本的跨越式下降。其中,V4-Pro-Max在 Agent能力、世界知识、推理性能 上已接近世界顶级闭源模型水平。官方预告,随着下半年 昇腾950超节点 批量上市,推理价格将大幅下调,正式开启技术普惠时代。
正文
1. 架构革新赋能效率跃升——全链路创新体系 
DeepSeek-V4的高效能源于从算法到底层基建的深度优化:
- 算法层面:创新性地采用 CSA(交叉空间注意力)与 HCA(混合通道注意力) 融合机制,配合 流形约束超连接(mHC) 与 Muon优化器。这些技术不仅提升了长上下文的运算效率,还显著加快了训练收敛速度。
- 底层基建:通过 MoE模块一体化融合内核、领域专用语言 TileLang 以及 FP4量化感知训练,实现了计算、通信与内存访问的高效协同。
- 效率突破:在百万Token场景下,单Token推理 FLOPs 及 KVCache占用 较前代V3.2大幅下降,为长文本应用的商业化普及扫清了障碍。
2. 国产算力协同适配——Day0双首发实现自主可控 
DeepSeek-V4发布当日即实现与国产顶级芯片的 Day0适配,标志着国产大模型与国产算力的深度共振:
- 寒武纪:基于 vLLM推理框架 完成适配并开源代码。通过自研融合算子库与高性能编程语言,深度释放了硬件的推理潜能。
- 华为昇腾:昇腾超节点全系列产品全面支持。昇腾950 通过融合kernel及多流并行技术,实现了 高吞吐、低时延 的部署性能;昇腾A3 亦完成适配,提供完整的训练参考实现。
这一合作模式极大推动了国内大模型软硬件产业的协同,对于构建 AI算力自主可控生态 具有里程碑意义。
结论与投资建议
重点标的推荐
- 国内算力:寒武纪、海光信息、中科曙光、润泽科技、浪潮信息、华丰科技、神州数码、百度集团、中芯国际、润建股份、云赛智联。
- 海外算力/存储:中际旭创、新易盛、天孚通信、工业富联、胜宏科技、兆易创新、源杰科技、英维克。
- CPU/半导体:海光信息、澜起科技、龙芯中科、中科曙光、中国长城。
- AI应用层:
- 大模型&Agent:智谱、科大讯飞、腾讯控股、阿里巴巴。
- AI Infra & 高壁垒应用:星环科技、中控技术、金蝶国际、德才股份、美年健康、汇量科技、范式智能。
风险提示
- 行业竞争加剧:全球模型迭代超预期导致竞争压力增大。
- 技术研发不及预期:架构创新或软硬适配可能存在不可预见的瓶颈。
- 资本开支波动:下游特定行业对AI投入的周期性波动风险。
延伸阅读
研报PDF原文链接