从DeepSeek“上新”看AI演进大模型将成“全能管家”？

ztb · 2025 年12 月 2 日 13:50

作者：科创板日报记者黄心怡| 发布时间：2025-12-02 19:45:28

DeepSeek“上新”看AI演进：大模型将成“全能管家”？

摘要： DeepSeek发布了V3.2系列模型，在推理能力、成本控制和智能体功能方面取得显著进展。专家认为，未来的大模型将发展为智能体平台，并将在垂直领域落地应用，最终演变为“全能管家”。

2025年12月2日，《科创板日报》报道了DeepSeek于12月1日晚间发布的 DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale 两个正式版模型。本次更新主要聚焦于推理能力的提升。

性能对比：
- 在Benchmark推理测试中，V3.2与GPT5、Claude 4.5各有优劣，Gemini 3 Pro优势明显。
- 与月之暗面Kimi-K2-Thinking相比，V3.2输出长度大幅降低，计算开销和用户等待时间显著减少。
技术亮点：
- 推理成本降低： 采用稀疏注意力机制，使 128K长上下文推理成本降低数倍，内存占用减少70%。
- 强化学习： 通过RL强化学习，在数学推理（IMO金牌）、编程（ICPC世界第二）等硬核任务中达到GPT-5水平。
- 智能体能力提升： 引入“思考保留”模式，支持工具调用嵌入推理链条，规避“记忆断裂”问题，智能体评测得分高于Kimi-K2-Thinking和MiniMax M2。
不足之处：
- 世界知识广度不及Gemini 3 Pro等领先专有模型。
- Token效率较低，解决复杂任务能力有待提高。
未来方向： DeepSeek计划通过增加预训练计算量填补知识空白，并优化模型推理链的智能密度以提高效率。

IDC中国研究总监卢言霞： 未来的大模型就是智能体平台，这是必然趋势。
快思慢想研究院院长田丰： 服务执行正在取代信息搜索。千问app、豆包AI、 DeepSeek等智能体，将购物、支付、物流、社交、娱乐等O2O服务融为一体，成为“全能管家”。
- 看好智能体解决行业专有问题，法律、财会、医疗等领域的智能体将成为刚需。

DeepSeek V3.2系列模型的发布，预示着AI大模型正朝着更智能、更高效的方向发展。大模型将不仅仅是信息提供者，更将成为能够执行复杂任务的“全能管家”。虽然目前仍存在一些局限性，但通过持续的技术投入和优化，未来可期。

延伸阅读
原文链接

话题	回复	浏览量
各大论坛 AI News 2025-04-09 18:46 - 2025-04-10 00:46 AI资讯	7	2025 年4 月 9 日
[华福证券]计算机行业定期报告：大模型硝烟再起，DeepSeek、通义千问、Google、OpenAI先后迎来更新热门研报	2	2025 年3 月 30 日
[甬兴证券]计算机行业点评：DeepSeek开启模型平权时代，AI应用前景可期热门研报	4	2025 年2 月 8 日
各大论坛 AI News 2025-12-02-00:13:51 AI资讯	5	2025 年12 月 1 日
各大论坛 AI News 2025-08-21 12:55 - 2025-08-21 18:55 AI资讯	12	2025 年8 月 21 日