AI在线 AI在线

​清华与星动纪元联合开源首个 AIGC 机器人大模型 VPP

近日,星动纪元宣布,已与清华大学叉院的 ISRLab 合作,开源了首个 AIGC(生成式人工智能内容)机器人大模型 ——VPP(视频预测策略)。 这一创新成果有望在机器人领域带来革命性的进展。 VPP 模型通过将视频扩散模型的泛化能力引入到通用机器人操作策略中,解决了以往机器人推理速度慢的问题。

近日,星动纪元宣布,已与清华大学叉院的 ISRLab 合作,开源了首个 AIGC(生成式人工智能内容)机器人大模型 ——VPP(视频预测策略)。这一创新成果有望在机器人领域带来革命性的进展。

QQ_1746605270503.png

VPP 模型通过将视频扩散模型的泛化能力引入到通用机器人操作策略中,解决了以往机器人推理速度慢的问题。VPP 能够实时预测未来动作,从而极大提升机器人的策略泛化能力。值得注意的是,这一模型已在国际机器学习大会(ICML2025)上获得 Spotlight 认可,展现出其研究的前沿性和重要性。

实时预测与高效执行

VPP 的一大亮点在于其预测能力。传统的机器人策略通常依赖于当前观测来进行动作学习,而 VPP 则能够提前 “预知” 未来的场景,从而在执行指令时显得更加从容。通过该模型,机器人的执行速度能够实现 “更快一步”,在仅需150毫秒的推理时间内,预测频率达到6-10Hz,控制频率更是超过50Hz,极大提升了动作执行的流畅性。

 跨本体学习的优势

在以往的模型中,不同类型机器人的数据难以融合,导致学习效率低下。而 VPP 能够直接利用多种形态机器人的视频数据进行学习,降低了对高质量真实数据的依赖。此外,VPP 还可通过学习人类动作数据,进一步提升模型的泛化能力。

 基准测试表现优异

在最近的 Calvin ABC-D 基准测试中,VPP 模型以4.33的任务完成平均长度接近满分5.0,展现出显著的性能优势。与之前的技术相比,VPP 提升幅度达41.5%。在真实世界的灵巧操作测试中,该模型在多任务学习和泛化能力上同样表现不俗,能完成超过100种复杂操作任务,显示出其在实际应用中的强大潜力。

VPP 模型的可解释性也是其一大亮点。开发者能够通过模型预测的视频提前识别潜在的失败场景,并进行针对性的调试与优化,相较于传统的端到端模型,这一优势使得开发过程更加高效。

项目地址:https://video-prediction-policy.github.io

相关资讯

清华与星动纪元联合发布首个 AIGC 机器人大模型 VPP

近日,清华大学叉院的 ISRLab 与北京星动纪元科技有限公司携手推出了首个 AIGC(人工智能生成内容)机器人大模型 ——VPP(视频预测策略)。 这一创新成果在2025年国际机器学习大会(ICML2025)上荣获 Spotlight 论文奖,显示出其在全球 AI 研究领域的前沿地位。 AIGC 技术近年来迅速崛起,从生成式文本模型到视频生成技术,其应用范围不断扩大。
5/7/2025 6:00:26 PM
AI在线

Judea Pearl推荐,UC伯克利研究者合著机器学习新书,可当研究生教材

前段时间,加州大学伯克利分校 Moritz Hardt 和 Benjamin Recht 合著的新书受到了广泛关注。这本书主要阐述了机器学习的模式、预测以及实现,并面向研究生使用。
5/18/2021 8:50:00 PM
机器之心

字节跳动发布 GR-2 机器人 AI 大模型:任务平均完成率 97.7%,模拟人类学习处理复杂任务

字节跳动研究团队最新推出了第二代机器人大模型 GR-2(Generative Robot2.0),其亮点在于创新构建“机器人婴儿期”学习阶段,模仿人类成长学习复杂任务,具备卓越的泛化能力和多任务通用性。 GR-2 模型和其它很多 AI 模型一样,包括预训练和微调两个过程。在预训练阶段,GR-2“观看”了多达 3800 万个来自各类公开数据集的互联网视频以及 500 亿个 tokens,涵盖了家庭、户外、办公室等多种日常场景,让 GR-2 具备在后续策略学习中跨越广泛机器人任务和环境的泛化能力。在微调阶段,团队使用机
10/10/2024 9:38:38 AM
故渊
  • 1