[甬兴证券]计算机行业点评:DeepSeek开启模型平权时代,AI应用前景可期

:memo: 作者: 李行杰,夏明达| :date: 发布时间:Sat, 08 Feb 2025 00:00:00 GMT

计算机行业点评:DeepSeek开启模型平权时代,AI应用前景可期


摘要

近日,深度求索(DeepSeek)正式发布DeepSeek-V3DeepSeek-R1模型并同步开源。DeepSeek-V3凭借6710亿参数的专家混合模型,性能可比肩世界顶尖闭源模型如GPT-4和Claude-3.5。DeepSeek-R1则在数学、代码、自然语言推理等任务上表现优异,API定价极具竞争力。此举标志着AI模型进入普惠发展期,技术平权时代到来,AI应用侧有望进入高速增长期。


正文

事件概述

据IT之家报道,深度求索近日发布了两款重磅模型:

  • DeepSeek-V3:6710亿参数的专家混合模型,性能媲美GPT-4和Claude-3.5等世界顶尖闭源模型。
  • DeepSeek-R1:在数学、代码、自然语言推理等任务上的表现与OpenAI o1正式版相当,API定价为:
    • 每百万输入tokens:缓存命中1元,缓存未命中4元
    • 每百万输出tokens:16元

核心观点

DeepSeek-V3:FP8精度及框架优化,助推训练成本“向下”

根据《DeepSeek-V3 Technical Report》(DeepSeek-AI, 2024),DeepSeek-V3通过引入FP8混合精度训练框架,首次在大规模模型上验证其有效性。该框架通过FP8计算和存储的支持,显著加速了训练过程并减少了GPU内存使用。

此外,DeepSeek设计了DualPipe算法,使模型扩展后仍能保持固定的通信成本。训练经济效益显著,预训练阶段的每万亿标记仅需180K H800 GPU小时。若假设H800 GPU租赁价格为每GPU小时2美元,总训练成本仅为557.6万美元


DeepSeek-R1:后训练及蒸馏,验证推理能力提升通路

根据《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》(DeepSeek-AI, 2025),DeepSeek-R1基于R1-Zero迭代而来,后者以V3-Base为基础模型,采用GRPO作为RL框架,未经监督微调(SFT),仍展现出卓越的推理能力。

R1在R1-Zero的基础上,通过冷启动数据微调和RL训练,表现达到了OpenAI-o1-1217水平。首次验证了大模型推理能力提升可以仅通过RL而无需SFT,具有较强启示意义。

在蒸馏方面,DeepSeek验证了“大”模型向“小”模型蒸馏所得到的密集模型表现优异。


模型平权时代到来,AI下游应用有望进入快速增长期

DeepSeek为代表的厂商持续降低API调用单价,同时国产模型性能不断提升,AI模型进入普惠发展期,技术平权时代已然到来。下游应用侧公司有望以更低成本享受更强基座性能,增益其经营表现,AI应用侧有望进入高速增长期。


投资建议

DeepSeek引领新一轮LLM性能及成本提质增效,有望带动AI应用进入发力阶段。建议关注各垂直行业AI进展,标的方面建议关注:

  • 科大讯飞
  • 金山办公
  • 泛微网络
  • 福昕软件
  • 致远互联
  • 润达医疗
  • 焦点科技
  • 润泽科技

风险提示

  • 产业发展不及预期
  • 政策推进力度不及预期
  • 国产替代不及预期

:rocket: DeepSeek的发布标志着AI模型平权时代的到来,AI应用前景可期!

:light_bulb: 延伸阅读
研报PDF原文链接