[上海证券]通信:25年度春节期间AI新闻信息汇总-DeepSeek引领效率模型潮流,中美AI竞赛提速

:memo: 作者: 刘京昭,杨昕东| :date: 发布时间:Fri, 07 Feb 2025 00:00:00 GMT

通信:25年度春节期间AI新闻信息汇总-DeepSeek引领效率模型潮流,中美AI竞赛提速

摘要

春节期间,人工智能题材新闻密集发酵,DeepSeek于海外广受关注,引领效率模型潮流,中美AI竞赛步入白热化阶段。DeepSeek R1 模型性能强劲,开源助力模型弯道超车,推动全球AI技术生态加速布局。同时,海外模型大厂动作频频,OpenAI发布o3-mini系列模型,商业化路径持续探索,AI竞赛加速推进。

正文

背景介绍

春节期间,人工智能题材新闻密集发酵,DeepSeek 于海外广受关注,话题讨论持续火热;海外模型陆续推出,中美AI竞赛步入白热化阶段。我们认为,相比于2024年度,AI模型、机器人本质上已获得显著的技术突破,商业化落地进程进一步加快,投资逻辑日益清晰。

分析与判断

一、国内层面:DeepSeek横空出世,开源助力模型弯道超车

DeepSeek全球爆火,R1模型性能强劲。 中国AI公司深度求索发布 DeepSeek R1,性能直接对标 ChatGPT o1正式版,并使用 MIT协议开源、支持免费商用、无需申请授权。

  • 1月26日,DeepSeek于AppStore免费应用下载榜上排名第一,并于 2月2日 登顶全球140个市场的应用商店下载榜。

我们认为,DeepSeek R1技术突破主要体现在三大维度:

  1. 训练路径优化:R1并未局限于规则驱动的数学模型或算法,而是成功地将强化学习带来的强大推理能力泛化到其他领域。
  2. 系统性工程创新:DeepSeek团队在“键值缓存(Key-Value cache)”的管理上以及推动“混合专家(MOE,mixture of experts)”方法的使用上进行创新性改进。
  3. 开源协同生态搭建:开源模型可吸纳更宽广、更多元的社区参与到AI开发中,并增强透明度与责任感,研究人员可以深入检查模型的训练数据,如若发现存在偏见或者侵权可及时进行反馈。

DeepSeek模型技术生态加速全球化布局,国内外云服务及硬件平台接入实现双向突破:

  1. 全球技术生态突破:1月31日,DeepSeek-R1作为NVIDIA NIM微服务预览版上线开发者平台,被官方认证为“最先进高效的大语言模型”;DeepSeek-R1同步登陆Amazon Bedrock与SageMaker平台。
  2. 国产化技术协同创新:硅基流动基于华为云昇腾云服务首发DeepSeek-V3/R1生产级推理服务,通过自研推理引擎优化,实现与全球高端GPU部署同等性能的模型响应效率。

二、海外层面:模型大厂动作频频,AI竞赛加速推进

OpenAI发布o3-mini系列模型,商业化路径持续探索。

  • OpenAI正式推出新一代推理模型 o3-mini系列,包含low、medium、high三个版本。
  • 定价策略与成本优势:o3-mini输入/输出定价分别为 1.10美元/百万token4.40美元/百万token,较o1-mini降低 63%,较满血版o1大幅缩减 93%,成本优化显著。
  • 性能突破与场景适配:o3-mini在数学、编程领域能力超越o1-mini,响应速度提升 24%,重大错误率下降 39%,在基准测试中表现突出,但安全性测试仍存改进空间。

OpenAI获2900亿新融资,市值突破2万亿。

  • OpenAI本轮计划融资规模达 400亿美元,对应投后估值突破 3000亿美元,仅次于SpaceX。
  • 核心融资进展及战略影响
    1. 软银拟投资 150亿至250亿美元,可能成为最大单一支持者。
    2. 此次融资将加速技术研发,拓展市场,并可能改变行业竞争格局。

xAI即将发布Grok-3,下周亮相推理能力力压OpenAI。

  • Grok-3 AI模型已开始内部测试,预计下周正式发布。
  • 测试显示其表现优于 o1DeepSeek R1 模型。

结论

投资建议

建议关注:

  • 芯片/服务器:浪潮信息、中科曙光、工业富联、寒武纪、海光信息、中芯国际
  • AI模型端:科大讯飞、金山办公、拓维信息、拓尔思
  • 端侧AI布局:广和通、移远通信、美格智能等

风险提示

  • 国内外行业竞争压力
  • 国际格局变动、贸易摩擦加剧风险
  • 新技术落地和商业化不及预期

:light_bulb: 延伸阅读
研报PDF原文链接