作者: 王伟|
发布时间:Thu, 13 Feb 2025 00:00:00 GMT
申港证券电子行业研究周报:AI降本有望加速端侧应用和推理算力需求
投资摘要
上周(2月3日至2月7日),申万电子行业指数上涨 6.14%,在申万31个行业中排名第4,跑赢沪深300指数 4.16%。申万电子行业三级子行业中,光学元件、模拟芯片设计、数字芯片设计、集成电路封测、LED指数表现突出,分别跑赢沪深300指数 8.36%、6.13%、6.09%、5.52%、5.20%。
每周一谈:AI降本有望加速端侧应用和推理算力需求
DeepSeek系列大模型 聚焦算法创新,带动AI训练和推理成本降低。DeepSeek近期发布 V3 和 R1 模型,以低成本实现性能对齐海外领军闭源模型。
- DeepSeek-V3 为自研MoE模型,拥有 671B参数,激活参数 37B,在 14.8T token 上进行了预训练。
- 生成吐字速度从 20TPS 大幅提高至 60TPS,相比V2.5模型实现了 3倍 的提升。
- 模型API服务定价为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元。
- DeepSeek-R1 模型推理能力提升,在数学、代码、自然语言推理等任务上,性能比肩 OpenAIo1正式版。
技术创新与成本优化
DeepSeek-V3的训练成本仅为 557.6万美元,约为 GPT-4的1/20,核心在于算法优化和数据效率提升,而非依赖算力堆叠。技术创新包括:
- 采用 MoE架构 和 门控网络(gating network),提高训练效率。
- 使用 FP8混合精度训练,实现训练加速和减少GPU内存使用。
- 引入 多头潜在注意力(MLA),实现高效推理和多Token预测(MTP)技术。
DeepSeek-R1在后训练阶段大规模使用了 强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。同时,开源了 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B模型,并通过输出蒸馏了 6个小模型 开源给社区,其中 32B和70B模型 在多项能力上实现了对标 OpenAIo1-mini 的效果。
AI芯片与云服务适配加速应用
根据芯东西公众号2月7日报道,摩尔线程、海光信息、华为昇腾等 16家国产AI芯片企业 相继宣布适配或上架DeepSeek模型服务。三大电信运营商、腾讯云、阿里云等云计算企业也相继宣布对DeepSeek的支持。海外企业如 英伟达、AMD、英特尔、Cerebras Systems、Groq,以及 亚马逊云科技、微软Azure 两大云计算巨头也宣布支持DeepSeek模型。
投资策略
我们认为,DeepSeek系列开源大模型对AI产业带来新的启发。大模型可以依靠算法创新而非算力堆叠获得高性价比,更低的调用成本将加速AI应用的爆发。
- 端侧AI应用 有望加快落地,云服务改善AI使用体验将促进移动端换机,有利于 AI手机、眼镜等消费电子 上量。
- 蒸馏小模型 的本地部署将带动 AIPC 等换机,端侧SoC和存储芯片等将迎来利好。
- 推理端算力需求 有望受益,算法创新和数据蒸馏等技术或将减弱对高性能算力硬件的依赖,加快国产AI算力生态的构建。
结论与建议
建议关注 AI需求驱动 和国产替代逻辑下的AI产业链及端侧消费电子相关标的:
- AI芯片与云服务公司:海光信息、中科曙光、瑞芯微、恒讯科技、兆易创新、中兴通讯、芯源微、三环集团、富创精密。
- 消费电子与先进制程代工:立讯精密、鹏鼎控股、领益智造、东山精密、环旭电子、中芯国际、北方华创、中微公司、华海清科、拓荆科技。
风险提示
- 贸易摩擦加剧
- 需求复苏不及预期
- 产能扩张不及预期
- 竞争加剧
延伸阅读
研报PDF原文链接