“价格屠夫”DeepSeek的理想主义:开源、降本与AI普惠

:memo: 作者: 科创板日报 郑远方| :date: 发布时间:2025-01-28 08:13:01

DeepSeek的理想主义:开源、降本与AI普惠

摘要

近期,DeepSeek发布的开源模型DeepSeek-R1在全球AI圈引起了巨大反响,不仅在性能上媲美OpenAI的o1,还以其低成本和开源特性被誉为“AI价格屠夫”。这一模型的发布,标志着一个新的AI发展路径——通过调整大模型的基础结构和有效利用有限资源,实现AI的普惠。

正文

DeepSeek-R1:开源模型的突破

DeepSeek-R1在数学、代码、自然语言推理等任务上的表现与OpenAI的o1正式版相当,且采用MIT许可协议,支持免费商用、任意修改和衍生开发。这一模型不仅展示了AI大模型的新制胜之道,还体现了DeepSeek对开源和普惠AI的承诺。

  • 开源大礼:DeepSeek-R1被誉为“一份给全球的开源大礼”,顶级风投A16Z创始人Marc Andreesen称赞其为“最令人惊叹的突破之一”。
  • 全球复现热潮:全球AI技术人员纷纷复现DeepSeek-R1,如UC伯克利的研究团队在游戏CountDown中复现了DeepSeek R1-Zero,成本仅不到30美元。

技术降本:AI价格屠夫

DeepSeek-R1的API服务定价极具竞争力:

  • 每百万输入tokens:1元(缓存命中)/4元(缓存未命中)
  • 每百万输出tokens:16元,仅为OpenAI o1的3%

DeepSeek不仅在定价上极具优势,还在技术上实现了大幅降本:

  • DeepSeek-V3:参数量高达671B的大模型,预训练成本仅557.6万美元,性能却足以比肩其他前沿大模型。
  • 技术创新:采用多头潜在注意力(MLA)和DeepSeekMoE,创新的多Token预测目标(MTP)显著提高了模型性能。

AI应用普及的前奏

DeepSeek的目标不仅是短期商业化,更在于实现AGI(通用人工智能)。随着模型性价比的持续提升,国内AI应用有望在各领域加速落地,特别是在Agent模式下,AI有望成为所有互联网用户的数字助手。

  • 国产模型竞争力:豆包pro、DeepSeek-v3等国产模型在文本、知识、多模态能力上接近海外前沿模型,API百万tokens输出定价普遍在10元以内,是GPT-4的1/3甚至更低。
  • 应用前景:AI应用在企业管理、教育、办公、金融等领域有望展现巨大价值。

结论

DeepSeek通过开源、降本和创新的技术路径,不仅推动了AI的普惠,还引领了全球AI技术的发展方向。其开源模型和低成本策略,或将改变AI产业的竞争格局,推动AI应用的普及和深入。

:glowing_star: DeepSeek的创新之路,正如其创始人梁文锋所言,“开源,发论文,其实并没有失去什么。对于技术人员来说,被follow是很有成就感的事。” DeepSeek的开放精神和技术突破,正逐渐成为AI领域的一股新力量,引领着AI普惠的新时代。

:light_bulb: 延伸阅读
原文链接