[华鑫证券]计算机行业周报:阿里深夜开源Qwen2.5-Omni,DeepSeek-V3 上线新版本

:memo: 作者: | :date: 发布时间:Sat, 05 Apr 2025 00:00:00 GMT

好的,已按照您的要求重新格式化研报如下:

华鑫证券 计算机行业周报:阿里深夜开源Qwen2.5-Omni,DeepSeek-V3 上线新版本 :rocket:

摘要

本周报聚焦计算机行业,重点关注阿里开源Qwen2.5-OmniDeepSeek-V3新版本发布。分析了新模型的性能提升和应用前景,以及AI融资动向。 强调DeepSeek-V3 在代码和逻辑推理能力上的显著提升,并为AI应用在垂直领域的渗透提出了投资建议。


正文

算力:算力租赁价格平稳,阿里深夜开源Qwen2.5-Omni :cloud:

3月27日凌晨,阿里通义千问团队发布 Qwen2.5-Omni。这是Qwen系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。

  • Thinker-Talker架构:一个端到端的多模态模型,旨在感知多种模态,并以流式方式生成文本和自然语音响应。
  • TMRoPE:新型位置嵌入,用于同步视频输入与音频的时间戳。
  • 实时语音和视频聊天:支持分块输入和即时输出。
  • 语音生成:超越现有模型,展现出卓越的稳健性和自然性。
  • 多模态性能:在所有模态上均展现出卓越的性能。在音频能力上超越了同样大小的Qwen2-Audio,并且达到了与Qwen2.5-VL-7B相当的性能;
  • 端到端语音指令遵循能力:在MMLU和GSM8K等基准测试中得到了证明。

Thinker负责处理和理解来自文本、音频和视频模态的输入,Talker则负责以流式方式输出离散的语音token。

AI应用:Gemini搜索访问量环比+6.85%,DeepSeek-V3上线新版本 :robot:

DeepSeek上线新版本DeepSeek-V3-0324,参数量为 6850亿,采用MIT开源协议,支持模型蒸馏、商业化应用。

  • 性能暴涨:击败了Claude3.5Sonnet,成为目前最强的非推理模型。
  • 代码能力:与Claude3.5Sonnet一决高下。
  • Aider多语言测试:拿下55%的成绩,成为仅次于Sonnet3.7的非推理类模型第二名。

在KCORES大模型竞技场中,DeepSeek-V3-0324以328.3分拿下第三名,仅次于Claude3.5Sonnet。在MisguidedAttention基准上,跃居非推理类模型榜首,甚至超越了Claude Sonnet3.7(非推理模型)。

AI融资动向:两兄妹再次出手惊艳AI圈,再次融资250亿 :money_bag:

Anthropic宣布完成E轮35亿美元(约合人民币250亿元)融资,投后估值615亿美元(约合人民币4450亿元)。融资将用于推进下一代AI系统发展、扩大计算能力、加深研究以及加速国际扩张。


投资建议 :chart_increasing:

DeepSeek-V3-0324的新版本代码能力显著提升,数学与逻辑推理能力增强,模型架构与开源生态进一步提升,凸显中国AI企业在技术与成本上的竞争力。借助新版DeepSeek-V3,Ai应用将在垂直领域加速渗透。建议关注:

  • 临床AI产品成功落地验证的嘉和美康(688246.SH)
  • 以AI为核心的龙头厂商科大讯飞(002230.SZ)
  • 芯片技术有望创新突破的寒武纪(688256.SH)
  • 高速通信连接器业务或显著受益于GB200放量的鼎通科技(688668.SH)
  • 已与Rokid等多家知名AI眼镜厂商建立紧密合作的亿道信息(001314.SZ)
  • 加快扩张算力业务的精密零部件龙头迈信林(688685.SH)
  • 持续加码高速铜缆的泓淋电力(301439.SZ)
  • 新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)

风险提示 :warning:

  • 1)AI底层技术迭代速度不及预期。
  • 2)政策监管及版权风险。
  • 3)AI应用落地效果不及预期。
  • 4)推荐公司业绩不及预期风险。

:light_bulb: 延伸阅读
研报PDF原文链接