作者: 李行杰,夏明达|
发布时间:Sat, 08 Feb 2025 00:00:00 GMT
计算机行业点评:DeepSeek开启模型平权时代,AI应用前景可期
摘要
近日,深度求索(DeepSeek)正式发布DeepSeek-V3及DeepSeek-R1模型并同步开源。DeepSeek-V3凭借6710亿参数的专家混合模型,性能可比肩世界顶尖闭源模型如GPT-4和Claude-3.5。DeepSeek-R1则在数学、代码、自然语言推理等任务上表现优异,API定价极具竞争力。此举标志着AI模型进入普惠发展期,技术平权时代到来,AI应用侧有望进入高速增长期。
正文
事件概述
据IT之家报道,深度求索近日发布了两款重磅模型:
- DeepSeek-V3:6710亿参数的专家混合模型,性能媲美GPT-4和Claude-3.5等世界顶尖闭源模型。
- DeepSeek-R1:在数学、代码、自然语言推理等任务上的表现与OpenAI o1正式版相当,API定价为:
- 每百万输入tokens:缓存命中1元,缓存未命中4元
- 每百万输出tokens:16元
核心观点
DeepSeek-V3:FP8精度及框架优化,助推训练成本“向下”
根据《DeepSeek-V3 Technical Report》(DeepSeek-AI, 2024),DeepSeek-V3通过引入FP8混合精度训练框架,首次在大规模模型上验证其有效性。该框架通过FP8计算和存储的支持,显著加速了训练过程并减少了GPU内存使用。
此外,DeepSeek设计了DualPipe算法,使模型扩展后仍能保持固定的通信成本。训练经济效益显著,预训练阶段的每万亿标记仅需180K H800 GPU小时。若假设H800 GPU租赁价格为每GPU小时2美元,总训练成本仅为557.6万美元。
DeepSeek-R1:后训练及蒸馏,验证推理能力提升通路
根据《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》(DeepSeek-AI, 2025),DeepSeek-R1基于R1-Zero迭代而来,后者以V3-Base为基础模型,采用GRPO作为RL框架,未经监督微调(SFT),仍展现出卓越的推理能力。
R1在R1-Zero的基础上,通过冷启动数据微调和RL训练,表现达到了OpenAI-o1-1217水平。首次验证了大模型推理能力提升可以仅通过RL而无需SFT,具有较强启示意义。
在蒸馏方面,DeepSeek验证了“大”模型向“小”模型蒸馏所得到的密集模型表现优异。
模型平权时代到来,AI下游应用有望进入快速增长期
以DeepSeek为代表的厂商持续降低API调用单价,同时国产模型性能不断提升,AI模型进入普惠发展期,技术平权时代已然到来。下游应用侧公司有望以更低成本享受更强基座性能,增益其经营表现,AI应用侧有望进入高速增长期。
投资建议
DeepSeek引领新一轮LLM性能及成本提质增效,有望带动AI应用进入发力阶段。建议关注各垂直行业AI进展,标的方面建议关注:
- 科大讯飞
- 金山办公
- 泛微网络
- 福昕软件
- 致远互联
- 润达医疗
- 焦点科技
- 润泽科技
风险提示
- 产业发展不及预期
- 政策推进力度不及预期
- 国产替代不及预期
DeepSeek的发布标志着AI模型平权时代的到来,AI应用前景可期!
延伸阅读
研报PDF原文链接