从DeepSeek“上新”看AI演进 大模型将成“全能管家”?

:memo: 作者: 科创板日报记者 黄心怡| :date: 发布时间:2025-12-02 19:45:28

DeepSeek“上新”看AI演进:大模型将成“全能管家”? :house:

摘要: DeepSeek发布了V3.2系列模型,在推理能力、成本控制和智能体功能方面取得显著进展。专家认为,未来的大模型将发展为智能体平台,并将在垂直领域落地应用,最终演变为“全能管家”。

正文

2025年12月2日,《科创板日报》报道了DeepSeek于12月1日晚间发布的 DeepSeek-V3.2DeepSeek-V3.2-Speciale 两个正式版模型。本次更新主要聚焦于推理能力的提升

  • 性能对比:

    • 在Benchmark推理测试中,V3.2与GPT5、Claude 4.5各有优劣,Gemini 3 Pro优势明显。
    • 与月之暗面Kimi-K2-Thinking相比,V3.2输出长度大幅降低,计算开销和用户等待时间显著减少:hourglass_not_done:
  • 技术亮点:

    • 推理成本降低: 采用稀疏注意力机制,使 128K长上下文推理成本降低数倍,内存占用减少70%:money_bag:
    • 强化学习: 通过RL强化学习,在数学推理(IMO金牌)、编程(ICPC世界第二)等硬核任务中达到GPT-5水平。:1st_place_medal:
    • 智能体能力提升: 引入“思考保留”模式,支持工具调用嵌入推理链条,规避“记忆断裂”问题,智能体评测得分高于Kimi-K2-Thinking和MiniMax M2。:brain:
  • 不足之处:

    • 世界知识广度不及Gemini 3 Pro等领先专有模型。
    • Token效率较低,解决复杂任务能力有待提高。
  • 未来方向: DeepSeek计划通过增加预训练计算量填补知识空白,并优化模型推理链的智能密度以提高效率。

专家观点

  • IDC中国研究总监卢言霞: 未来的大模型就是智能体平台,这是必然趋势。
  • 快思慢想研究院院长田丰: 服务执行正在取代信息搜索。千问app、豆包AI、 DeepSeek等智能体,将购物、支付、物流、社交、娱乐等O2O服务融为一体,成为“全能管家”。 :toolbox:
    • 看好智能体解决行业专有问题,法律、财会、医疗等领域的智能体将成为刚需。

结论

DeepSeek V3.2系列模型的发布,预示着AI大模型正朝着更智能、更高效的方向发展。大模型将不仅仅是信息提供者,更将成为能够执行复杂任务的“全能管家”。 虽然目前仍存在一些局限性,但通过持续的技术投入和优化,未来可期。 :rocket:

:light_bulb: 延伸阅读
原文链接