作者: 科创板日报 宋子乔|
发布时间:2025-01-21 09:14:26
国产AI“三英”战OpenAI:DeepSeek、月之暗面、MiniMax相继上新 战况如何?
摘要
国产大模型在追赶OpenAI的GPT系列上展现出强劲的实力,DeepSeek、Kimi、MiniMax等公司相继发布新模型,性能接近甚至超越OpenAI的现有模型,同时定价更具性价比。
正文
DeepSeek发布DeepSeek-R1,性能媲美OpenAI
1月20日,DeepSeek正式发布DeepSeek-R1,并同步开源模型权重。该模型在后训练阶段大规模使用强化学习技术,在仅有极少标注数据的情况下,极大提升了模型的推理能力。
根据测试数据,DeepSeek-R1在以下测试中表现优异:
- 美国AIME 2024
- MATH-500
- SWE-bench Verified
所有测试中,DeepSeek-R1的比分均超越了OpenAI o1正式版。
Kimi发布k1.5多模态思考模型
同一天,Kimi发布了全新的k1.5多模态思考模型。在long-CoT模式下,Kimi k1.5的数学、代码、多模态推理能力达到了OpenAI o1正式版的水平。
在short-CoT模式下,Kimi k1.5的表现更是大幅超越了全球范围内的短思考SOTA模型,领先达到550%。
MiniMax发布Minimax-01,性能突出
1月15日,MiniMax发布了全新的开源模型系列Minimax-01。该模型在多个标准和内部基准测试中,性能与GPT-4o、Claude3.5-Sonnet等顶尖模型相当,尤其在长上下文处理方面表现突出。
OpenAI最新进展
OpenAI在2024年分别发布了:
- 5月:GPT-4o
- 9月:GPT-o1(包括o1-preview和o1-mini)
- 12月:GPT-o3
目前o3是最强大的模型,具备出色的推理能力、科学知识掌握和编码能力。o1则在编码、数学和写作方面表现优异,支持图片上传和视觉推理。
性价比对比:国产模型更具优势
以DeepSeek为代表的国产大模型不仅在性能上追赶OpenAI,定价也展现了极致性价比:
- DeepSeek-R1 API服务定价:
- 每百万输入tokens:1元(缓存命中)/4元(缓存未命中)
- 每百万输出tokens:16元
相比之下,OpenAI的定价更高:
- GPT-o1模型:
- 每百万输入tokens:15美元(约合人民币110元)
- 每百万输出tokens:60美元(约合人民币438元)
- GPT-4o mini:
- 每百万输入tokens:10美元(约合人民币73元)
- 每百万输出tokens:20美元(约合人民币146元)
国产算力需求持续增长
国内外大模型厂商的快速迭代表明,算力的需求仍在持续增加。据火山引擎智能算法负责人吴迪表示,字节跳动预计到2027年,豆包每天的Token消耗量将超过100万亿,是现在的100倍以上。
1月20日消息显示,字节跳动旗下的芜湖江东名邑科技有限公司计划在安徽芜湖建设火山引擎长三角算力中心项目,总投资达到80亿元,设计服务器机柜数为21824台,网络机柜236台。
此外,小米也在积极搭建自己的GPU万卡集群,并对AI大模型进行大规模投资。
结论
随着字节跳动、幻方、小米等国内厂商在AI领域的积极布局,国产大模型有望快速崛起,推动国产算力需求的增长。国产算力产业链将迎来新的发展机遇,服务器、液冷设备、PCB厂商以及存储、光模块和光芯片等企业也将受益于这一趋势。
延伸阅读
原文链接