作者: |
发布时间:Sun, 30 Mar 2025 00:00:00 GMT
华福证券:计算机行业定期报告 - 大模型硝烟再起
摘要:
大模型领域近期迎来新一轮更新,DeepSeek、通义千问、Google、OpenAI等厂商纷纷推出或升级其模型,展现出更强大的能力和更广泛的应用前景。本次报告聚焦这些重要更新,分析其技术特点和潜在影响,并提示相关风险。
正文
1. DeepSeek-V3 模型更新,各项能力全面进阶 
DeepSeek 官方宣布,3月25日完成了 DeepSeek-V3 模型的小版本升级,版本号为 DeepSeek-V3-0324。
- 本次升级仅改进了后训练方法,基础模型保持不变。
- 模型参数约为 660B。
- 开源版本上下文长度为 128K(网页端、App和API提供 64K 上下文)。
- 私有化部署只需更新 checkpoint 和 tokenizer_config.json。
2. 通义千问 Qwen2.5-Omni-7B 正式开源,展现全模态优异性能 
阿里云于 3月27日正式开源通义千问 Qwen2.5-Omni-7B。
- 首个端到端全模态大模型,可同时处理文本、图像、音频和视频等多种输入。
- 能够实时生成文本与自然语音合成输出,实现多感官交互。
- 支持音视频识别情绪,进行更智能、更自然的反馈与决策。
- 开发者和企业可免费下载商用,手机等终端硬件亦可轻松部署。
3. 谷歌发布 “最先进复杂任务模型” Gemini 2.5 Pro,支持原生多模态 
谷歌于 3月26日发布 Gemini 2.5 Pro。
- 相较于 Gemini 2.0 Flash Thinking,Gemini 2.5 在基础模型和后训练技术上均有改进。
- 在推理、数学、科学、编程基准上表现出色。
- 编程能力与 Claude 3.7 Sonnet 匹敌,数学能力媲美 Grok 3。
4. OpenAI 放出 GPT-4o 原生多模态图像生成功能 
OpenAI 于 3月26日发布了 GPT-4o image generation 模型。
- 初始版本专注于图像创建,适用于 ChatGPT Plus、Pro、Team 和 Free 订阅层。
- 价格显著降低,与 GPT-4 Turbo 相比降低了 50%。
- GPT-4o 成本为 5 美元/百万输入 token 和 15 美元/百万输出 token。
- GPT-3.5 成本为 0.50 美元/百万输入 token 和 1.50 美元/百万输出 token,即 GPT-4o 是 GPT-3.5 的 10 倍。
- OpenAI 首次向免费 ChatGPT 用户提供 “最佳” 模型。
结论
大模型领域的竞争日益激烈,各厂商在模型能力、模态支持、开源策略等方面不断创新。本次更新预示着大模型技术发展进入新的阶段,将为各行业带来更广阔的应用前景。 ![]()
风险提示 
- 市场需求不及预期
- 人工智能技术发展不及预期
- 政策发布不及预期
- 大模型商业落地不及预期的风险
延伸阅读
研报PDF原文链接