作者: 吴起涤|
发布时间:Fri, 14 Feb 2025 00:00:00 GMT
DeepSeek专题研究:“低成本、高性能、强推理”三位一体,DeepSeek驱动高质量模型平价化
摘要
自2024年起,DeepSeek在AI领域迅速崛起,通过密集的模型更新和创新技术,实现了低成本、高性能和强推理的三大特点。DeepSeek不仅在短时间内积累了大量用户,还在多个测评中表现优异,推动了模型平价化的发展。本文将探讨DeepSeek的技术优势、市场表现及投资机会。
正文
DeepSeek模型密集更新,用户数将持续高速增长 
自2024年起,DeepSeek在AI领域迅速崛起并不断迭代。2024年12月底至2025年1月底,DeepSeek发布了多个重要版本,包括DeepSeek-V3、DeepSeek-R1以及深耕图像领域的视觉和多模态模型。
- 用户增长:2024年12月底到2025年1月底,全球用户数从34.7万激增至1.19亿。
- 市场表现:DeepSeek仅用一年多时间就达到ChatGPT两年的用户规模,在国内1月跃居月均活跃用户数榜首,APP下载量也大幅增长。
DeepSeek具备低成本、高性能、强推理三大特点 
低成本
- DeepSeek-V3通过算法创新和工程优化,大幅提升模型效率,训练成本仅为557万美元,耗时不到两个月。
- DeepSeek-R1在后训练阶段大规模使用强化学习技术,减少数据标注量和计算资源浪费,降低成本。
高性能
- AIME2024测评:DeepSeek在数学、代码、自然语言推理等任务上,获得79.8%的pass@1得分,略微超过OpenAI-01。
- MATH-500:DeepSeek获得97.3%的得分,与OpenAI-01性能相当,显著优于其他模型。
强推理
- DeepSeek在极少标注数据的情况下,极大提升了模型推理能力,特别是在复杂任务中表现出色。
DeepSeek驱动模型平价化,建议关注算力、AI应用和端侧的投资机会 
算力
- 随着更多用户对DeepSeek的使用,以及未来更多AI应用的不断涌现,对算力的需求呈现出几何级增长趋势。
- AI技术的进步虽然提高了模型效率,但不断增长的用户和应用数量对算力资源提出了更高要求,消耗也随之剧增。
B端应用
- AI Agent正在对传统SaaS应用进行全面重构,具备强大的自主学习能力,能够自动理解文档内容,实现更加高效的知识管理,为企业的数字化转型提供了有力支持。
C端应用
- 作为生成式AI的重要商业化应用,AI Agent在电商、教育、旅游、酒店以及客服等多个行业得到了广泛应用。
端侧
- AI正在内容、应用、硬件、生态上影响世界,AI Agent从“数字”走向“具身”。随着市场发展,大模型更广泛地接入硬件产品,做好软硬件协同发展是未来竞争的关键。
投资建议 
算力环节
- 建议关注以国产算力和AI推理需求为核心的算力环节,尤其是IDC、服务器、国产芯片等算力配套产业,推荐海光信息、浪潮信息。
AI应用开发
- DeepSeek迅速集成进各云厂商的平台中,直接拉高模型能力下限,AI应用开发提速升级。建议关注:
- B端:鼎捷数智、用友网络
- C端:金山办公
端侧模型部署
- 小模型能力提升促进了端侧模型部署,看好AI终端作为新一代计算平台爆发可能。建议关注:
- 科大讯飞
- 立讯精密
- 歌尔股份
结论
DeepSeek通过技术创新和密集的模型更新,实现了低成本、高性能和强推理的三大特点,推动了模型平价化的发展。随着用户数量的快速增长和广泛的应用场景,DeepSeek在AI领域的影响力将持续扩大。建议关注算力、AI应用和端侧的投资机会,抓住AI技术发展的红利期。
风险提示 
- AI产业商业化落地不及预期的风险
- 市场竞争加剧风险
- 政策不确定性风险
延伸阅读
研报PDF原文链接