[浙江大学]DeepSeek系列专题线上公开课(第二季):从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例

:memo: 作者: | :date: 发布时间:Tue, 25 Mar 2025 00:00:00 GMT

DeepSeek 系列专题线上公开课(第二季):大模型推理能力发展简史 :rocket:

摘要

本次课程回顾了大模型的发展历程,重点关注了ChatGPT的成功及其对对话式AI的推动作用。分析了早期大模型在推理能力上的不足,以及OpenAI o1/o3和DeepSeek-R1等模型在推理能力上的突破性进展。强调了技术积累对大模型能力提升的重要性。

正文

ChatGPT 的成功 :trophy:

OpenAI 于 2022年11月 发布 ChatGPT,在短短 三个月 内日活跃用户从零增长至超过 3000万,标志着对话式AI进入大众应用阶段。这意味着什么?对话式AI真正走入了我们的生活!:tada:

大模型能力不断增长 :flexed_biceps:

大模型在知识问答、数学、编程等能力上达到了新的高度,在多种任务上的表现超越了人类水平。

早期大模型推理能力短板 :pensive_face:

  • 早期大语言模型易产生幻觉。
  • 数学推理方面,推理能力严重不足,表现在:
    • 简单数值比较错误
    • 多步推理能力弱
    • 推理不一致

对大模型的质疑 :thinking:

Yann LeCun 批判观点:对纯粹扩大规模方法的根本质疑。

Mehrdad Farajtabar 观点:

  • “LLM 本质上是统计模式匹配工具,而非真正的推理系统”
  • “下一个词预测框架不足以产生真正的理解”

推理能力突破:OpenAI o1/o3、DeepSeek-R1 :glowing_star:

2023-2024年,推理能力取得突破性进展:

  • OpenAI o1/o3 在数学和代码推理任务上的卓越表现。
  • 开源大模型 DeepSeek-R1 在 MATH 基准上达到 87.2% 的准确率。这是一个非常出色的成绩!:100:

结论

早期大模型在推理能力上存在不足。OpenAI-o 系列模型和 DeepSeek-R1 等模型的成功,主要在于其较强的推理能力。随着技术的不断发展,我们有理由期待大模型在各领域发挥更大的作用。:rocket:

:light_bulb: 延伸阅读
研报PDF原文链接