[甬兴证券]计算机行业点评：DeepSeek开启模型平权时代，AI应用前景可期

yfc · 2025 年2 月 8 日 10:37

作者：李行杰,夏明达| 发布时间：Sat, 08 Feb 2025 00:00:00 GMT

计算机行业点评：DeepSeek开启模型平权时代，AI应用前景可期

摘要

近日，深度求索（DeepSeek）正式发布DeepSeek-V3及DeepSeek-R1模型并同步开源。DeepSeek-V3凭借6710亿参数的专家混合模型，性能可比肩世界顶尖闭源模型如GPT-4和Claude-3.5。DeepSeek-R1则在数学、代码、自然语言推理等任务上表现优异，API定价极具竞争力。此举标志着AI模型进入普惠发展期，技术平权时代到来，AI应用侧有望进入高速增长期。

正文

事件概述

据IT之家报道，深度求索近日发布了两款重磅模型：

DeepSeek-V3：6710亿参数的专家混合模型，性能媲美GPT-4和Claude-3.5等世界顶尖闭源模型。
DeepSeek-R1：在数学、代码、自然语言推理等任务上的表现与OpenAI o1正式版相当，API定价为：
- 每百万输入tokens：缓存命中1元，缓存未命中4元
- 每百万输出tokens：16元

核心观点

DeepSeek-V3：FP8精度及框架优化，助推训练成本“向下”

根据《DeepSeek-V3 Technical Report》（DeepSeek-AI, 2024），DeepSeek-V3通过引入FP8混合精度训练框架，首次在大规模模型上验证其有效性。该框架通过FP8计算和存储的支持，显著加速了训练过程并减少了GPU内存使用。

此外，DeepSeek设计了DualPipe算法，使模型扩展后仍能保持固定的通信成本。训练经济效益显著，预训练阶段的每万亿标记仅需180K H800 GPU小时。若假设H800 GPU租赁价格为每GPU小时2美元，总训练成本仅为557.6万美元。

DeepSeek-R1：后训练及蒸馏，验证推理能力提升通路

根据《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》（DeepSeek-AI, 2025），DeepSeek-R1基于R1-Zero迭代而来，后者以V3-Base为基础模型，采用GRPO作为RL框架，未经监督微调（SFT），仍展现出卓越的推理能力。

R1在R1-Zero的基础上，通过冷启动数据微调和RL训练，表现达到了OpenAI-o1-1217水平。首次验证了大模型推理能力提升可以仅通过RL而无需SFT，具有较强启示意义。

在蒸馏方面，DeepSeek验证了“大”模型向“小”模型蒸馏所得到的密集模型表现优异。

模型平权时代到来，AI下游应用有望进入快速增长期

以DeepSeek为代表的厂商持续降低API调用单价，同时国产模型性能不断提升，AI模型进入普惠发展期，技术平权时代已然到来。下游应用侧公司有望以更低成本享受更强基座性能，增益其经营表现，AI应用侧有望进入高速增长期。

投资建议

DeepSeek引领新一轮LLM性能及成本提质增效，有望带动AI应用进入发力阶段。建议关注各垂直行业AI进展，标的方面建议关注：

科大讯飞
金山办公
泛微网络
福昕软件
致远互联
润达医疗
焦点科技
润泽科技

风险提示

产业发展不及预期
政策推进力度不及预期
国产替代不及预期

DeepSeek的发布标志着AI模型平权时代的到来，AI应用前景可期！

延伸阅读
研报PDF原文链接

话题	回复	浏览量
[东莞证券]电子行业深度报告：DeepSeek推动模型平权，关注AI终端及算力领域热门研报	4	2025 年2 月 21 日
[东莞证券]半导体行业事件点评：deepseek大模型实现训练降本，有望加快AI应用场景落地热门研报	7	2025 年2 月 5 日
[华龙证券]AI产业系列跟踪专题研究报告：从DeepSeek看国内AI产业趋势热门研报	3	2025 年2 月 14 日
[国信证券]AI事件点评：DeepSeek发布高性价比开源模型，有望拉平模型差距、加速AI云与应用发展热门研报	4	2025 年2 月 4 日
[东莞证券]计算机行业事件点评：Deepseek撼动全球AI产业，助力AI应用、AI端侧落地加速热门研报	2	2025 年2 月 5 日