AI在线 AI在线

人形机器人自主控制新突破:智元等实现 VLA 驱动全身协同,行走与操作同时完成

AI在线 12 月 17 日消息,智元 AGIBOT 今日官宣,来自香港大学、智元 AGIBOT、复旦大学和上海创智学院的联合研究团队提出了 WholeBodyVLA,这是一种面向真实世界的人形机器人全身 Vision–Language–Action 框架。 该工作基于智元灵犀 X2 研究发布,将 VLA 扩展至双足人形机器人的全身控制,验证了其在全身 loco-manipulation 任务中的可行性。 与原地操作相比,loco-manipulation 的难点不在于单一技能,而在于行走与操作必须在同一任务中长期、稳定地协同发生。

AI在线 12 月 17 日消息,智元 AGIBOT 今日官宣,来自香港大学、智元 AGIBOT、复旦大学和上海创智学院的联合研究团队提出了 WholeBodyVLA,这是一种面向真实世界的人形机器人全身 Vision–Language–Action 框架。

人形机器人自主控制新突破:智元等实现 VLA 驱动全身协同,行走与操作同时完成

该工作基于智元灵犀 X2 研究发布,将 VLA 扩展至双足人形机器人的全身控制,验证了其在全身 loco-manipulation 任务中的可行性。

图片

图片

图片

图片

与原地操作相比,loco-manipulation 的难点不在于单一技能,而在于行走与操作必须在同一任务中长期、稳定地协同发生。围绕这一挑战,WholeBodyVLA 总结出限制 loco-manipulation 发展的两个核心问题:真机数据稀缺以及运动执行中的不稳定性,并引入两项关键方案:

  • 从人类视频中学习:通过从第一视角人类视频中学习移动与操作的潜在动作表示,模型能够不依赖大规模机器人遥操数据,直接获取对 loco-manipulation 行为的统一语义理解,从而显著缓解人形机器人遥操作数据稀缺、采集成本高的问题。

  • 面向移动操作的 RL 控制器:将通用连续运动控制目标简化为一组离散运动指令,仅保留 loco-manipulation 必要的强化学习训练目标,从而显著提升了控制器在运动执行时的稳定性。

研究团队在智元灵犀 X2 人形机器人上进行了大量真机实验验证,发现 WholeBodyVLA 具有以下能力:

01、大范围、长程移动操作任务

图片

02、距离泛化性

得益于统一潜在动作学习阶段获取的 manipulation-aware locomotion 知识,WholeBodyVLA 能从不同的位置出发、并停止在目标物体处完成操作任务。

图片

图片

03、操作泛化性

得益于统一潜在动作学习阶段获取的 manipulation 知识,WholeBodyVLA 也对不同的场景、物体、位置表现出一定的操作泛化性。

图片

图片

04、地形泛化性

得益于 LMO 改进的运控稳定性,WholeBodyVLA 能够在干扰地形上仍然保持基本准确的移动方向和平衡。

图片

图片

总的来说,WholeBodyVLA 展示了 VLA 扩展到双足人形机器人自主全身控制的可行路径。通过从人类视频中学习,并结合针对移动操作的 RL 控制器,WholeBodyVLA 使机器人能够在真实世界中稳定完成行走与操作交织的长时序任务,为推动人形机器人走向制造、服务、物流等复杂场景提供重要基础。

人形机器人自主控制新突破:智元等实现 VLA 驱动全身协同,行走与操作同时完成

AI在线附项目链接如下:

https://opendrivelab.com/WholeBodyVLA/

相关资讯

告别传统家务!Figure 2025 年将启动人形机器人家庭测试

加州湾区的机器人初创公司 Figure 日前宣布,其人形机器人 Figure02将在2025年开始进行家庭环境中的 “alpha测试”。 该公司的首席执行官布雷特・阿德科克(Brett Adcock)表示,这一时间表的提前得益于其自主研发的 “通用” 视觉 - 语言 - 行动(VLA)模型 Helix。 在 Figure 宣布 Helix 平台的消息不久后,阿德科克在一次活动中透露,该平台旨在处理视觉数据和自然语言输入,从而加快机器人学习新任务的速度。
2/28/2025 5:29:00 PM
AI在线

智元机器人灵犀X2定档5月22日开售,三款型号售价10万起

在今日举行的灵犀X2媒体沟通会上,智元机器人正式宣布旗下新一代人形机器人“灵犀X2”将于5月22日正式开售,用户现已可通过智元机器人官网登记留资选购。 据智元机器人灵犀业务部总裁魏强介绍,灵犀X2定位为小尺寸室内人形机器人,高度为1.3米,支持直充充电,具备高自由度的运动能力与多模态人机交互方式,面向文娱商演、展厅导览、科研教育、情感陪伴等多元场景。 新品共推出三个版本,分别为:灵犀X2(交互版):注重基础对话与互动能力;X2Pro(探索版):适配科研与教育探索等进阶应用;X2Ultra(旗舰版):提供最完整功能配置,覆盖复杂任务执行。
5/21/2025 4:00:55 PM
AI在线

智元机器人灵犀X2启动合作伙伴招募,目标2026年实现数千台出货

近日,国内具身智能领域的头部企业——智元机器人宣布,其全新一代人形机器人产品“灵犀X2”正式启动合作伙伴招募,涵盖灵犀X2(交互版)、X2Pro(探索版)、X2Ultra(旗舰版)三款型号。 根据智元机器人的规划,灵犀X2系列机器人将在2025年下半年实现规模化出货,并计划在2026年底前达成“数千台”的交付目标。 灵犀X2的核心竞争力在于其突破性的“情绪交互”能力。
5/26/2025 10:01:00 AM
AI在线