瞄准机器人“推理大脑”!英伟达推出具身智能推理模型Cosmos Reason

:memo: 作者: 财联社 史正丞| :date: 发布时间:2025-08-12 01:22:04

:fire: 英伟达推出具身智能推理模型 Cosmos Reason,瞄准机器人“推理大脑”!:robot::brain:

摘要: 英伟达在SIGGRAPH大会上推出 Cosmos Reason 模型,这是一个参数量仅 70亿 的开源视觉推理模型,旨在赋予机器人和AI代理更强的推理和行动能力,使其能够像人类一样理解环境并执行复杂任务。该模型已被应用于数据整理、自动驾驶训练和自动化即时配送等多个领域。


正文:

在2025年8月11日开幕的SIGGRAPH大会上,“全球股王”英伟达 :crown: 推出了一系列面向机器人开发者的世界模型、应用库和基础设施,进一步加码机器人领域。其中,最受瞩目的是 参数量仅为70亿 的开源物理AI应用和机器人视觉推理模型 Cosmos Reason

英伟达介绍称,Cosmos Reason 模型能够使机器人和AI具身代理“像人类一样推理”,并在真实世界中采取行动。通过记忆和理解能力,该模型能够解决多步骤任务,并应对模糊或新颖的现实体验。

在英伟达给出的案例中,运行视觉推理模型的机器人手臂,能够根据“面包+烤面包机”的场景,推断出最合理的下一步动作是将面包放进烤面包机进行烘烤 :bread:,并将思考逻辑转化成机器手臂的操作指令。

:light_bulb: Cosmos Reason 的核心功能在于“机器人规划与推理”。它充当机器人的“大脑”,负责有意识、条理化的决策。视觉推理模型能够解释环境,并在面对复杂指令时将其分解为任务并利用常识执行。

该模型还能用于一系列AI应用,例如自动化对大规模、多样化训练数据集进行整理、标注,也能从海量视频数据中提取有价值的信息并进行归因分析。

:globe_showing_europe_africa: 商业化应用方面, 英伟达披露,公司内部的机器人和自动驾驶团队正在使用该模型进行数据整理与过滤、标注以及VLA(视觉语言动作)后训练。优步(Uber)也在使用该模型为自动驾驶训练数据进行标注与生成说明。 麦格纳国际正在使用该模型开发全自动即时配送解决方案 City Delivery,用来帮助车辆更快适应新城市环境。VAST Data、Milestone Systems 也在交通监控自动化、视觉检测等领域应用该模型。

此外,英伟达还在Cosmos世界模型中新增了 Cosmos Transfer-2,加速从3D仿真等场景生成合成数据,以及一个经过蒸馏、更为注重速度优化的 Cosmos Transfers 版本。 同时,英伟达更新了Omniverse软件开发工具包,并公布了新的神经重建库,允许开发者使用传感器数据在三维中模拟现实世界。


结论:

英伟达此次发布的一系列机器人解决方案,尤其是 Cosmos Reason 模型的推出,预示着AI芯片巨头正在加速进军机器人领域,试图将其培养成AI数据中心之外的下一个重要应用场景。 :robot::chart_increasing: 这将对机器人产业的发展产生深远影响。

:light_bulb: 延伸阅读
原文链接