英伟达推出新型模型 Cosmos-Reason1 ，让 AI 更好理解物理世界

作者：AI在线 2025-05-21 04:00

近日，英伟达发布了其最新的 Cosmos-Reason1系列模型，旨在提升人工智能在物理常识和具身推理方面的能力。随着人工智能在语言处理、数学及代码生成等领域取得显著进展，如何将这些能力扩展到物理环境中成为了一大挑战。物理 AI（Physical AI）不同于传统的人工智能，它依赖于视频等感官输入，并结合现实物理法则来生成反应。

近日，英伟达发布了其最新的 Cosmos-Reason1系列模型，旨在提升人工智能在物理常识和具身推理方面的能力。随着人工智能在语言处理、数学及代码生成等领域取得显著进展，如何将这些能力扩展到物理环境中成为了一大挑战。

物理 AI（Physical AI）不同于传统的人工智能，它依赖于视频等感官输入，并结合现实物理法则来生成反应。物理 AI 的应用领域包括机器人和自动驾驶车辆等，需要具备常识推理能力和对空间、时间及物理规律的深入理解。

然而，现有的 AI 模型在与物理世界的连接上依然存在弱点，无法直观理解重力或空间关系，这使得其在具身任务中的表现不佳。直接在物理世界中进行训练的成本高昂且风险巨大，这在一定程度上阻碍了物理 AI 的发展。

为了解决这些问题，英伟达的 Cosmos-Reason1模型提出了创新的解决方案。该系列模型包括 Cosmos-Reason1-7B 和 Cosmos-Reason1-56B 两个版本，采用了物理 AI 监督微调和强化学习两大训练阶段。

研究团队引入了双本体系统，一个分层本体将物理常识分为空间、时间和基础物理三大类，另一个本体则映射人类、机械臂和人形机器人等具身代理的推理能力。

模型架构采用了仅解码器的大型语言模型，结合视觉编码器以处理视频数据，从而实现文本和视觉数据的同步推理。为此，团队构建了针对物理常识的三个基准测试，涵盖604个问题和426个视频，以及针对具身推理的六个基准，包含610个问题和600个视频。

经过训练，Cosmos-Reason1模型在物理常识和具身推理基准测试中表现出色，特别是在强化学习训练后，在预测下一步行动、验证任务完成及评估物理可行性等方面取得了显著进展。

随着 Cosmos-Reason1系列模型的推出，英伟达为物理推理任务提供了新的解决方案，未来在机器人和自动驾驶领域的应用潜力可期。

入口:https://github.com/nvidia-cosmos/cosmos-reason1

划重点:
🌟 英伟达发布 Cosmos-Reason1系列模型，提升 AI 在物理推理中的能力。
🤖 该模型采用双本体系统，通过视频和文本数据进行同步推理。
📈 在基准测试中，Cosmos-Reason1模型在物理常识和具身推理方面表现优异。

推理延展到真实物理世界，英伟达Cosmos-Reason1：8B具身推理表现超过OpenAI ο1

在基于物理世界的真实场景进行视觉问答时，有可能出现参考选项中没有最佳答案的情况，比如以下例子：很显然，这里最佳的答案应该是直行，但预先提供的 4 个选项中并没有这个答案。也因此，目前的大多数 AI 在面临这个问题时往往并不能识别题中陷阱，会试图从选项中找到正确答案。比如下面展示了 ChatGPT 的回答：当然，在日常的视觉问答任务中，这样的错误无伤大雅，但一旦涉及到真实的任务场景（比如真正的自动驾驶），这样的错误就是无法容忍的了。

3/25/2025 12:38:00 PM

机器之心

北京大学推出新基准评测PHYBench，挑战AI物理推理能力！

最近，北京大学物理学院联合多个院系，推出了一项名为 “PHYBench” 的全新评测基准，旨在检验大模型在物理推理上的真实能力。该项目由朱华星老师和曹庆宏副院长主导，汇聚了来自物理学院和其他学科的200多名学生，其中不少人曾在全国中学生物理竞赛中获金牌。 PHYBench 设计了500道精心制作的高质量物理题，这些题目涵盖高中物理、大学物理及物理奥林匹克竞赛的各个层面。

4/29/2025 11:00:51 AM

AI在线

英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员

英伟达最新发布 Llama Nemotron 系列开放推理 AI 模型，支持“智能体 AI”系统，可独立推理、规划并执行多步骤任务，适用于机器人、自动化和决策优化等场景，显著降低推理成本，助力企业实现 AI 自主化升级。

3/20/2025 11:17:47 AM

故渊

英伟达推出新型模型 Cosmos-Reason1 ，让 AI 更好理解物理世界

相关资讯

推理延展到真实物理世界，英伟达Cosmos-Reason1：8B具身推理表现超过OpenAI ο1

北京大学推出新基准评测PHYBench，挑战AI物理推理能力！

英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员