AI在线 AI在线

英伟达发布全新 Cosmos Reason 模型,加速机器人与物理 AI 发展

英伟达周一在 SIGGRAPH 大会上发布了一系列面向机器人开发者的全新世界 AI 模型、库及基础设施,其中最引人关注的是参数规模达70亿的“推理型”视觉语言模型 Cosmos Reason,专为物理 AI 应用与机器人设计。 此次加入现有 Cosmos 系列的还包括 Cosmos Transfer-2,可基于3D 模拟场景或空间控制输入加速生成合成数据,以及一款更强调速度优化的精简版 Cosmos Transfer。 英伟达表示,这些模型可用于生成训练机器人和 AI 智能体所需的合成文本、图像和视频数据集。

英伟达周一在 SIGGRAPH 大会上发布了一系列面向机器人开发者的全新世界 AI 模型、库及基础设施,其中最引人关注的是参数规模达70亿的“推理型”视觉语言模型 Cosmos Reason,专为物理 AI 应用与机器人设计。

此次加入现有 Cosmos 系列的还包括 Cosmos Transfer-2,可基于3D 模拟场景或空间控制输入加速生成合成数据,以及一款更强调速度优化的精简版 Cosmos Transfer。英伟达表示,这些模型可用于生成训练机器人和 AI 智能体所需的合成文本、图像和视频数据集。

英伟达

据介绍,Cosmos Reason 具备记忆与物理理解能力,能够作为规划模型推断实体智能体的下一步行动,应用场景包括数据筛选、机器人规划与视频分析。

英伟达还发布了新的神经重建库,其中包含一种利用传感器数据将现实世界以3D 方式模拟的渲染技术。该技术也将被整合进开源模拟器 CARLA 这一广受开发者欢迎的平台。此外,Omniverse 软件开发套件也迎来了更新。

在硬件与平台方面,公司推出了适配机器人开发工作流的全新服务器——Nvidia RTX Pro Blackwell Server,提供统一架构支持;以及基于云端的管理平台 Nvidia DGX Cloud。

这一系列发布,显示出英伟达正加速布局机器人领域,力求在 AI 数据中心之外,为其 AI GPU 寻找下一个重大应用场景。

相关资讯

英伟达推出新型模型 Cosmos-Reason1 ,让 AI 更好理解物理世界

近日,英伟达发布了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常识和具身推理方面的能力。 随着人工智能在语言处理、数学及代码生成等领域取得显著进展,如何将这些能力扩展到物理环境中成为了一大挑战。 物理 AI(Physical AI)不同于传统的人工智能,它依赖于视频等感官输入,并结合现实物理法则来生成反应。
5/21/2025 4:00:55 PM
AI在线

英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员

英伟达最新发布 Llama Nemotron 系列开放推理 AI 模型,支持“智能体 AI”系统,可独立推理、规划并执行多步骤任务,适用于机器人、自动化和决策优化等场景,显著降低推理成本,助力企业实现 AI 自主化升级。
3/20/2025 11:17:47 AM
故渊

推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

在基于物理世界的真实场景进行视觉问答时,有可能出现参考选项中没有最佳答案的情况,比如以下例子:很显然,这里最佳的答案应该是直行,但预先提供的 4 个选项中并没有这个答案。 也因此,目前的大多数 AI 在面临这个问题时往往并不能识别题中陷阱,会试图从选项中找到正确答案。 比如下面展示了 ChatGPT 的回答:当然,在日常的视觉问答任务中,这样的错误无伤大雅,但一旦涉及到真实的任务场景(比如真正的自动驾驶),这样的错误就是无法容忍的了。
3/25/2025 12:38:00 PM
机器之心
  • 1