作者: 财联社 史正丞|
发布时间:2025-02-01 04:29:07
OpenAI推出o3-mini推理模型,免费用户首次可体验推理功能
摘要
面对来自“东方AI力量”的竞争压力,美国OpenAI公司于周五正式推出了轻量级推理模型o3-mini,并首次向免费用户开放推理功能。o3-mini在性能和灵活性上表现出色,尤其是在推理努力程度调整方面,能够根据需求在速度和准确性之间做出平衡。
正文
o3-mini模型简介
OpenAI的o3-mini推理模型首次亮相于去年12月的直播活动中,与“满血版”的o3模型一同发布。o3模型被宣称具备更先进、近似人类的推理能力,尤其在编程、数学、科学等理工科领域,其表现超越了现役的o1模型。
o3-mini支持开发者调整“AI推理努力程度”的选项,分为低、中、高三个级别。这种灵活性使得o3-mini在面对难题时可以“更努力思考”,而在需要效率时则优先考虑回应速度。
性能测试
在2024年美国数学邀请赛(AIME 2024)的测试中,o3-mini的表现如下:
- 低努力程度:准确率约为60%,与o1-mini相当,但速率更快。
- 中等努力程度:准确率提升至79.6%,与o1模型相当。
- 高努力程度:准确率进一步攀升至87.3%。
在博士级科学问题(GPQA Diamond)的测试中,o3-mini在三种努力程度下的准确率分别为70.6%、76.8%和79.7%。
竞争对手对比
与DeepSeek-R1模型相比,o3-mini在AIME 2024测试中的准确率为79.8%,而在GPQA Diamond测试中的准确率为71.5%。尽管DeepSeek的表现略逊一筹,但它的出现促使OpenAI加快了向用户开放推理功能的步伐。
结论
OpenAI宣布,从周五开始,免费ChatGPT用户也能通过在编辑器中选择“推理”来尝试o3-mini模型,这是公司推理模型首次向免费用户开放。对于付费用户,o3-mini将在模型选择器中替代o1-mini。作为升级的一部分,ChatGPT Plus和Team用户的速率限制从每天50条提升到150条,而ChatGPT Pro用户则可以无限制地访问o3-mini。
这一举措标志着OpenAI在应对竞争压力的同时,也更加注重用户体验和市场拓展。
延伸阅读
原文链接