[华福证券]计算机行业定期报告:大模型硝烟再起,DeepSeek、通义千问、Google、OpenAI先后迎来更新

:memo: 作者: | :date: 发布时间:Sun, 30 Mar 2025 00:00:00 GMT

华福证券:计算机行业定期报告 - 大模型硝烟再起:rocket:

摘要:

大模型领域近期迎来新一轮更新,DeepSeek、通义千问、Google、OpenAI等厂商纷纷推出或升级其模型,展现出更强大的能力和更广泛的应用前景。本次报告聚焦这些重要更新,分析其技术特点和潜在影响,并提示相关风险。


正文

1. DeepSeek-V3 模型更新,各项能力全面进阶 :up_button:

DeepSeek 官方宣布,3月25日完成了 DeepSeek-V3 模型的小版本升级,版本号为 DeepSeek-V3-0324。

  • 本次升级仅改进了后训练方法,基础模型保持不变。
  • 模型参数约为 660B
  • 开源版本上下文长度为 128K(网页端、App和API提供 64K 上下文)。
  • 私有化部署只需更新 checkpoint 和 tokenizer_config.json。

2. 通义千问 Qwen2.5-Omni-7B 正式开源,展现全模态优异性能 :megaphone:

阿里云于 3月27日正式开源通义千问 Qwen2.5-Omni-7B。

  • 首个端到端全模态大模型,可同时处理文本、图像、音频和视频等多种输入。
  • 能够实时生成文本与自然语音合成输出,实现多感官交互。
  • 支持音视频识别情绪,进行更智能、更自然的反馈与决策。
  • 开发者和企业可免费下载商用,手机等终端硬件亦可轻松部署。

3. 谷歌发布 “最先进复杂任务模型” Gemini 2.5 Pro,支持原生多模态 :robot:

谷歌于 3月26日发布 Gemini 2.5 Pro。

  • 相较于 Gemini 2.0 Flash Thinking,Gemini 2.5 在基础模型和后训练技术上均有改进。
  • 在推理、数学、科学、编程基准上表现出色。
  • 编程能力与 Claude 3.7 Sonnet 匹敌,数学能力媲美 Grok 3。

4. OpenAI 放出 GPT-4o 原生多模态图像生成功能 :framed_picture:

OpenAI 于 3月26日发布了 GPT-4o image generation 模型。

  • 初始版本专注于图像创建,适用于 ChatGPT Plus、Pro、Team 和 Free 订阅层。
  • 价格显著降低,与 GPT-4 Turbo 相比降低了 50%
  • GPT-4o 成本为 5 美元/百万输入 token15 美元/百万输出 token
  • GPT-3.5 成本为 0.50 美元/百万输入 token1.50 美元/百万输出 token,即 GPT-4o 是 GPT-3.5 的 10 倍
  • OpenAI 首次向免费 ChatGPT 用户提供 “最佳” 模型。

结论

大模型领域的竞争日益激烈,各厂商在模型能力、模态支持、开源策略等方面不断创新。本次更新预示着大模型技术发展进入新的阶段,将为各行业带来更广阔的应用前景。 :money_bag:


风险提示 :warning:

  • 市场需求不及预期
  • 人工智能技术发展不及预期
  • 政策发布不及预期
  • 大模型商业落地不及预期的风险

:light_bulb: 延伸阅读
研报PDF原文链接