[源达信息]DeepSeek专题研究:“低成本、高性能、强推理”三位一体,DeepSeek驱动高质量模型平价化

:memo: 作者: 吴起涤| :date: 发布时间:Fri, 14 Feb 2025 00:00:00 GMT

DeepSeek专题研究:“低成本、高性能、强推理”三位一体,DeepSeek驱动高质量模型平价化

摘要

自2024年起,DeepSeek在AI领域迅速崛起,通过密集的模型更新和创新技术,实现了低成本、高性能和强推理的三大特点。DeepSeek不仅在短时间内积累了大量用户,还在多个测评中表现优异,推动了模型平价化的发展。本文将探讨DeepSeek的技术优势、市场表现及投资机会。

正文

DeepSeek模型密集更新,用户数将持续高速增长 :rocket:

自2024年起,DeepSeek在AI领域迅速崛起并不断迭代。2024年12月底至2025年1月底,DeepSeek发布了多个重要版本,包括DeepSeek-V3DeepSeek-R1以及深耕图像领域的视觉和多模态模型。

  • 用户增长:2024年12月底到2025年1月底,全球用户数从34.7万激增至1.19亿
  • 市场表现:DeepSeek仅用一年多时间就达到ChatGPT两年的用户规模,在国内1月跃居月均活跃用户数榜首,APP下载量也大幅增长。

DeepSeek具备低成本、高性能、强推理三大特点 :light_bulb:

低成本

  • DeepSeek-V3通过算法创新和工程优化,大幅提升模型效率,训练成本仅为557万美元,耗时不到两个月。
  • DeepSeek-R1在后训练阶段大规模使用强化学习技术,减少数据标注量和计算资源浪费,降低成本。

高性能

  • AIME2024测评:DeepSeek在数学、代码、自然语言推理等任务上,获得79.8%的pass@1得分,略微超过OpenAI-01
  • MATH-500:DeepSeek获得97.3%的得分,与OpenAI-01性能相当,显著优于其他模型。

强推理

  • DeepSeek在极少标注数据的情况下,极大提升了模型推理能力,特别是在复杂任务中表现出色。

DeepSeek驱动模型平价化,建议关注算力、AI应用和端侧的投资机会 :briefcase:

算力

  • 随着更多用户对DeepSeek的使用,以及未来更多AI应用的不断涌现,对算力的需求呈现出几何级增长趋势。
  • AI技术的进步虽然提高了模型效率,但不断增长的用户和应用数量对算力资源提出了更高要求,消耗也随之剧增。

B端应用

  • AI Agent正在对传统SaaS应用进行全面重构,具备强大的自主学习能力,能够自动理解文档内容,实现更加高效的知识管理,为企业的数字化转型提供了有力支持。

C端应用

  • 作为生成式AI的重要商业化应用,AI Agent在电商、教育、旅游、酒店以及客服等多个行业得到了广泛应用。

端侧

  • AI正在内容、应用、硬件、生态上影响世界,AI Agent从“数字”走向“具身”。随着市场发展,大模型更广泛地接入硬件产品,做好软硬件协同发展是未来竞争的关键。

投资建议 :chart_increasing:

算力环节

  • 建议关注以国产算力和AI推理需求为核心的算力环节,尤其是IDC、服务器、国产芯片等算力配套产业,推荐海光信息、浪潮信息

AI应用开发

  • DeepSeek迅速集成进各云厂商的平台中,直接拉高模型能力下限,AI应用开发提速升级。建议关注:
    • B端:鼎捷数智、用友网络
    • C端:金山办公

端侧模型部署

  • 小模型能力提升促进了端侧模型部署,看好AI终端作为新一代计算平台爆发可能。建议关注:
    • 科大讯飞
    • 立讯精密
    • 歌尔股份

结论

DeepSeek通过技术创新和密集的模型更新,实现了低成本、高性能和强推理的三大特点,推动了模型平价化的发展。随着用户数量的快速增长和广泛的应用场景,DeepSeek在AI领域的影响力将持续扩大。建议关注算力、AI应用和端侧的投资机会,抓住AI技术发展的红利期。

风险提示 :warning:

  • AI产业商业化落地不及预期的风险
  • 市场竞争加剧风险
  • 政策不确定性风险

:light_bulb: 延伸阅读
研报PDF原文链接