作者: |
发布时间:Tue, 25 Mar 2025 00:00:00 GMT
DeepSeek 系列专题线上公开课(第二季):大模型推理能力发展简史 
摘要
本次课程回顾了大模型的发展历程,重点关注了ChatGPT的成功及其对对话式AI的推动作用。分析了早期大模型在推理能力上的不足,以及OpenAI o1/o3和DeepSeek-R1等模型在推理能力上的突破性进展。强调了技术积累对大模型能力提升的重要性。
正文
ChatGPT 的成功 
OpenAI 于 2022年11月 发布 ChatGPT,在短短 三个月 内日活跃用户从零增长至超过 3000万,标志着对话式AI进入大众应用阶段。这意味着什么?对话式AI真正走入了我们的生活!![]()
大模型能力不断增长 
大模型在知识问答、数学、编程等能力上达到了新的高度,在多种任务上的表现超越了人类水平。
早期大模型推理能力短板 
- 早期大语言模型易产生幻觉。
- 数学推理方面,推理能力严重不足,表现在:
- 简单数值比较错误
- 多步推理能力弱
- 推理不一致
对大模型的质疑 
Yann LeCun 批判观点:对纯粹扩大规模方法的根本质疑。
Mehrdad Farajtabar 观点:
- “LLM 本质上是统计模式匹配工具,而非真正的推理系统”
- “下一个词预测框架不足以产生真正的理解”
推理能力突破:OpenAI o1/o3、DeepSeek-R1 
2023-2024年,推理能力取得突破性进展:
- OpenAI o1/o3 在数学和代码推理任务上的卓越表现。
- 开源大模型 DeepSeek-R1 在 MATH 基准上达到 87.2% 的准确率。这是一个非常出色的成绩!

结论
早期大模型在推理能力上存在不足。OpenAI-o 系列模型和 DeepSeek-R1 等模型的成功,主要在于其较强的推理能力。随着技术的不断发展,我们有理由期待大模型在各领域发挥更大的作用。![]()
延伸阅读
研报PDF原文链接