AI在线 AI在线

英伟达推出新型模型 Cosmos-Reason1 ,让 AI 更好理解物理世界

近日,英伟达发布了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常识和具身推理方面的能力。 随着人工智能在语言处理、数学及代码生成等领域取得显著进展,如何将这些能力扩展到物理环境中成为了一大挑战。 物理 AI(Physical AI)不同于传统的人工智能,它依赖于视频等感官输入,并结合现实物理法则来生成反应。

近日,英伟达发布了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常识和具身推理方面的能力。随着人工智能在语言处理、数学及代码生成等领域取得显著进展,如何将这些能力扩展到物理环境中成为了一大挑战。

image.png

物理 AI(Physical AI)不同于传统的人工智能,它依赖于视频等感官输入,并结合现实物理法则来生成反应。物理 AI 的应用领域包括机器人和自动驾驶车辆等,需要具备常识推理能力和对空间、时间及物理规律的深入理解。

然而,现有的 AI 模型在与物理世界的连接上依然存在弱点,无法直观理解重力或空间关系,这使得其在具身任务中的表现不佳。直接在物理世界中进行训练的成本高昂且风险巨大,这在一定程度上阻碍了物理 AI 的发展。

为了解决这些问题,英伟达的 Cosmos-Reason1模型提出了创新的解决方案。该系列模型包括 Cosmos-Reason1-7B 和 Cosmos-Reason1-56B 两个版本,采用了物理 AI 监督微调和强化学习两大训练阶段。

研究团队引入了双本体系统,一个分层本体将物理常识分为空间、时间和基础物理三大类,另一个本体则映射人类、机械臂和人形机器人等具身代理的推理能力。

模型架构采用了仅解码器的大型语言模型,结合视觉编码器以处理视频数据,从而实现文本和视觉数据的同步推理。为此,团队构建了针对物理常识的三个基准测试,涵盖604个问题和426个视频,以及针对具身推理的六个基准,包含610个问题和600个视频。

经过训练,Cosmos-Reason1模型在物理常识和具身推理基准测试中表现出色,特别是在强化学习训练后,在预测下一步行动、验证任务完成及评估物理可行性等方面取得了显著进展。

随着 Cosmos-Reason1系列模型的推出,英伟达为物理推理任务提供了新的解决方案,未来在机器人和自动驾驶领域的应用潜力可期。

入口:https://github.com/nvidia-cosmos/cosmos-reason1

划重点:  

🌟  英伟达发布 Cosmos-Reason1系列模型,提升 AI 在物理推理中的能力。  

🤖  该模型采用双本体系统,通过视频和文本数据进行同步推理。  

📈  在基准测试中,Cosmos-Reason1模型在物理常识和具身推理方面表现优异。  

相关资讯

推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

在基于物理世界的真实场景进行视觉问答时,有可能出现参考选项中没有最佳答案的情况,比如以下例子:很显然,这里最佳的答案应该是直行,但预先提供的 4 个选项中并没有这个答案。 也因此,目前的大多数 AI 在面临这个问题时往往并不能识别题中陷阱,会试图从选项中找到正确答案。 比如下面展示了 ChatGPT 的回答:当然,在日常的视觉问答任务中,这样的错误无伤大雅,但一旦涉及到真实的任务场景(比如真正的自动驾驶),这样的错误就是无法容忍的了。
3/25/2025 12:38:00 PM
机器之心

北京大学推出新基准评测PHYBench,挑战AI物理推理能力!

最近,北京大学物理学院联合多个院系,推出了一项名为 “PHYBench” 的全新评测基准,旨在检验大模型在物理推理上的真实能力。 该项目由朱华星老师和曹庆宏副院长主导,汇聚了来自物理学院和其他学科的200多名学生,其中不少人曾在全国中学生物理竞赛中获金牌。 PHYBench 设计了500道精心制作的高质量物理题,这些题目涵盖高中物理、大学物理及物理奥林匹克竞赛的各个层面。
4/29/2025 11:00:51 AM
AI在线

英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员

英伟达最新发布 Llama Nemotron 系列开放推理 AI 模型,支持“智能体 AI”系统,可独立推理、规划并执行多步骤任务,适用于机器人、自动化和决策优化等场景,显著降低推理成本,助力企业实现 AI 自主化升级。
3/20/2025 11:17:47 AM
故渊
  • 1