AI在线 AI在线

英伟达推出 Cosmos-Reason1 系列模型,让 AI 理解物理常识

英伟达针对物理推理任务,设计推出了 Cosmos-Reason1 系列模型,提升了 AI 在物理常识和具身推理方面的表现,为机器人、自动驾驶车辆等领域带来实际应用潜力。

科技媒体 marktechpost 昨日(5 月 20 日)发布博文,报道称英伟达针对物理推理任务,设计推出了 Cosmos-Reason1 系列模型,提升了 AI 在物理常识和具身推理方面的表现,为机器人、自动驾驶车辆等领域带来实际应用潜力。

Physical AI 挑战

人工智能(AI)在语言处理、数学和代码生成领域取得显著进步,但将其能力扩展到物理环境仍面临挑战。

不同于传统 AI,Physical AI(物理 AI)依赖视频等感官输入,结合现实物理法则生成反应,涉及导航、操作和交互等任务,需要常识推理和对空间、时间及物理规律的具身理解。

AI 模型目前对物理世界的连接薄弱,无法直观理解重力或空间关系,导致在具身任务中表现不佳,而直接在物理世界中训练成本高且风险大,严重阻碍了开发进程。

Cosmos-Reason1:创新突破物理推理

英伟达最新推出 Cosmos-Reason1 系列模型,迎接上述挑战,为物理推理提供了新方案。

AI在线援引博文介绍,该模型分为 Cosmos-Reason1-7B 和 Cosmos-Reason1-56B 两个版本,通过 Physical AI Supervised Fine-Tuning(SFT)和 Physical AI Reinforcement Learning(RL)两个阶段训练。

英伟达推出 Cosmos-Reason1 系列模型,让 AI 理解物理常识

研究团队引入双本体系统:一个分层本体将物理常识分为空间、时间和基础物理三大类,细化为 16 个子类;另一个二维本体则映射人类、机械臂、人形机器人等五种具身代理的推理能力。

模型架构采用仅解码器的大型语言模型(LLM),结合视觉编码器处理视频数据,实现文本和视觉数据的同步推理。训练数据包含约 400 万条标注视频-文本对,涵盖动作描述和复杂推理任务。

团队为此构建了针对物理常识的三个基准(604 个问题,426 个视频)和针对具身推理的六个基准(610 个问题,600 个视频)。

英伟达推出 Cosmos-Reason1 系列模型,让 AI 理解物理常识

Cosmos-Reason1 模型在物理常识和具身推理基准测试中表现出色,尤其在 RL 训练后,模型在预测下一步行动、验证任务完成和评估物理可行性等方面取得显著进步。

英伟达推出 Cosmos-Reason1 系列模型,让 AI 理解物理常识

相关资讯

消息称 DeepSeek-R2 AI 模型开发进程因美国当局英伟达 H20 芯片出口限制而延迟

由于美国当局对英伟达H20芯片的出口限制,DeepSeek R2 AI模型的开发进程被迫延迟。这不仅影响了新模型的研发,也对现有R1模型的实际部署造成困扰。#AI芯片# #DeepSeek#
6/27/2025 8:09:47 AM
漾仔

Mistral AI 在欧洲推出 Mistral Compute 云平台,进军基础设施市场

Mistral AI 宣布推出 Mistral Compute AI 云平台,正式进军 AI 基础设施市场,与微软 Azure、亚马逊 AWS 等竞争。平台基于英伟达 GPU 和 Mistral 自家训练工具包,提供从裸机到全托管 PaaS 的解决方案。目前服务覆盖欧洲,未来将扩展至中东、亚洲等地。#AI云平台# #MistralAI#
6/14/2025 3:34:10 PM
漾仔

突发!英伟达收购贾扬清新创业的Lepton AI

出品 | 51CTO技术栈(微信号:blog51cto)刚刚,有外媒曝出英伟达即将收购成立两年的 AI 创业公司 Lepton AI。 Lepton AI 的创始人是AI圈内知名人士贾扬清。 据悉这笔收购交易的金额是数亿美元。
3/27/2025 8:50:38 AM
  • 1