AI在线 AI在线

重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0 

当仿真环境的真实性逼近物理世界,当场景构建的效率以“自然对话”和“分钟”来衡量,具身智能的研发范式将发生根本性改变。 智元机器人在CES国际消费电子展首日正式发布首个大语言模型驱动的开源仿真平台——Genie Sim 3.0。 基于NVIDIA Isaac Sim ,Genie Sim 3.0 融合三维重建与视觉生成,打造数字孪生级的高保真环境;首创大语言模型驱动,让万级场景的生成只需几分钟;同步开源包含真实机器人作业场景的上万小时仿真数据集;并构建了覆盖10万 场景的多维度智能评估体系,为模型能力绘制全景画像。

当仿真环境的真实性逼近物理世界,当场景构建的效率以“自然对话”和“分钟”来衡量,具身智能的研发范式将发生根本性改变。智元机器人在CES国际消费电子展首日正式发布首个大语言模型驱动的开源仿真平台——Genie Sim 3.0。基于NVIDIA Isaac Sim ,Genie Sim 3.0 融合三维重建与视觉生成,打造数字孪生级的高保真环境;首创大语言模型驱动,让万级场景的生成只需几分钟;同步开源包含真实机器人作业场景的上万小时仿真数据集;并构建了覆盖10万+场景的多维度智能评估体系,为模型能力绘制全景画像。

从数字资产生成、场景泛化、数据采集到自动评测的全流程功能,这一整套完整闭环的解决方案,将显著加速模型训练验证,降低对物理硬件的依赖,助力开发者与研究者的研发效率,推动具身智能的创新应用。

  • 项目主页:https://agibot-world.com/genie-sim
  • Github: github.com/AgibotTech/genie_sim
  • Modelscope: https://modelscope.cn/datasets/agibot_world/GenieSim3.0-Dataset

重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0 五大核心亮点,开启具身仿真新纪元

01/ 数字孪生级高保真仿真环境

传统仿真难以兼顾视觉逼真与物理真实。Genie Sim 3.0 开创性地将三维重建、视觉生成技术与物理引擎深度融合,实现了视觉真实感与物理精确性的统一。

  • 精准重建:依托 MetaCam 手持3D激光扫描仪,结合高分辨率RGB、360° LiDAR点云与厘米级RTK定位,实现对真实环境的毫米级精准复刻。
  • 视觉增强:利用视觉生成模型,智能合成新视角图像增强3D重建,极大提升了仿真环境的视觉逼真度。
  • 资产生成:对于任意物体,仅需一段60秒环拍视频,即可快速生成带精确网格的仿真模型,大幅提升场景构建效率。

02/ 首创自然语言驱动的场景生成与泛化

告别手动编写复杂逻辑的场景生成方式,在Genie Sim平台中,开发者输入自然语言指令即可驱动平台在分钟级内自动生成、泛化成千上万个训练与测试场景。

  • 对话式创建:直接输入如「生成一份蛋白质和维生素含量丰富的晚餐」的指令,平台自动理解并构建出结构化的仿真场景。
  • 智能编辑与泛化:生成场景自带结构化信息与视觉预览,可进一步通过对话进行场景增广、细节增删、布局调整,最终输出满足要求的仿真场景。

重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0 03/ 全量开源仿真数据集与高效采集方案

具身领域最大规模开源仿真数据集,涵盖200余项任务、总时长上万小时,为模型研发提供坚实的数据基石。

  • 多维度数据:数据集包含RGB-D、双目视觉、全身关节状态等多传感器信息,并覆盖背景、布局、光照、噪声等多种泛化维度。
  • 智能采集工具:平台提供低延迟遥操作与自动任务编排双模式采集,结合自动化标注实现高效数据生产。
  • 独创错误恢复机制:任务失败后可自动回退至关键节点续采,将数据采集损耗降至最低。
  • 零样本Sim2Real:仿真数据训练完成后,实现零样本迁移到真实世界,任务成功率超过真实数据训练。

重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0 重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0 04/ 超十万仿真场景,勾勒模型全景能力画像

模型评估不再仅限于“成功率”。Genie Sim Benchmark 3.0 构建了基于 10万+ 仿真场景的立体评估体系,结合LLM与VLM技术,从多个维度为模型绘制深度能力画像,是当前业界覆盖最全面、最权威的具身智能模型评估基准。

  • 自动化评测生成:评测指令与步骤可由LLM根据场景语义自动生成,并转化为可执行流程。
  • 多维度深度评估:通过视觉语言模型(VLM),从语义理解、空间推理、操作精度、时序逻辑等多维度进行综合评价,清晰揭示模型的能力边界与薄弱环节,指引明确的优化方向。
  • 重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0 重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0 虚实一致的评测结果:仿真与真实世界评测差异<10%,模型验证无需真机部署,显著提升算法评测效率。

重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0 重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0 05/ 涵盖真实作业场景仿真

基于智元的规模化商用和工业落地经验,Genie Sim 3.0 是首个深度集成真实作业场景仿真数采与评测的开源平台,打通从实验室算法到工业应用落地。

  • 真实作业场景还原:平台包含超市上货、物流分拣、电力巡检、物料搬运、产线装配等多个工业场景的机器人作业环境。
  • 全流程仿真验证:基于重建资产快速生成训练数据集与全流程评测系统,大幅降低数据采集成本与算法验证周期,实现“零硬件部署,全真实验证”。

建开源共享,共创智能未来

Genie Sim 3.0 仿真平台核心代码、海量高价值数据集以及数字资产全面开源,向全球开发者、研究者与产业伙伴开放。

无论您是高校实验室的研究者,还是具身智能领域的算法工程师,或是来自制造业、物流业等领域的集成应用专家,Genie Sim 3.0旨在让每一位具身智能的探索者,都能拥有接近无限的仿真场景、逼近真实的训练环境、科学全面的评估标尺,从而将精力更聚焦于算法与模型本身的创新。

开发者可访问GitHub开源主页:github.com/AgibotTech/genie_sim,获取代码、数据集与详细文档。

相关资讯

行业首款,智元发布具身智能一站式开发平台 Genie Studio

行业首款,智元发布具身智能一站式开发平台 Genie Studio

智元机器人今日发布行业首款面向具身智能开发者的一站式开发平台 Genie Studio。据介绍,Genie Studio 是智元机器人专为具身智能场景打造的一站式开发平台,具备数据采集、模型训练、仿真评测、模型推理的全链路产品能力,让“采”、“训”、“测”、“推”每个环节都能找到标准化解决方案。平台优势如下: · 提供覆盖数据全生命周期的数据解决方案,高效采集海量数据,单机单日产能高达 1000 条。 · 提供自研和主流开源机器人基座模型,打通训练、微调、量化、部署链路,降低训练门槛。 · 提供仿真评测能力,拥有 6000 + 物体资产与仿真场景,实现用户侧场景重建、专家轨迹数据获取、评测结果可视化。 · 提供“⼀键真机部署”能力,轻松实现算法从云端到真机环境的无缝迁移,比传统方案单卡推理性能提升 2-3 倍。
4/21/2025 5:00:37 PM 归泷
一文读懂开源 AI Agent 工作流构建新范式-Sim Studio

一文读懂开源 AI Agent 工作流构建新范式-Sim Studio

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的开源 AI Agent 工作流引擎 - Sim Studio。 在大模型应用爆发的当下,越来越多团队开始尝试构建属于自己的 AI Agent。 然而从 LLM 接入、任务解析、插件整合到执行流程编排,整个链路不仅复杂,而且难以维护。
7/17/2025 4:00:00 AM Luga Lee
vivo AI Lab提出自我进化的移动GUI智能体,UI-Genie无需人工标注实现性能持续提升

vivo AI Lab提出自我进化的移动GUI智能体,UI-Genie无需人工标注实现性能持续提升

本文来自于香港中文大学 MMLab 和 vivo AI Lab,其中论文第一作者肖涵,主要研究方向为多模态大模型和智能体学习,合作作者王国志,研究方向为多模态大模型和 Agent 强化学习。 项目 leader 任帅,研究方向为多模态大模型、Agent 及具身智能,指导教师是香港中文大学 MMLab 的李鸿升教授。 近年来,多模态大模型(MLLM)在理解和生成任务上取得了巨大突破。
11/7/2025 3:25:00 PM 机器之心