AI在线 AI在线

麻省理工学院推出可调节的生成 AI 工具,助力机器人虚拟训练

近日,麻省理工学院(MIT)的计算机科学与人工智能实验室(CSAIL)与丰田研究院共同推出了一款名为 “可引导场景生成”(steerable scene generation)的生成式 AI 工具,旨在提升机器人学习能力。 这款新工具能够创建虚拟训练环境,如厨房、客厅和餐厅,以供工程师测试机器人如何处理现实生活中的任务。 图源备注:图片由AI生成,图片授权服务商Midjourney该平台经过训练,基于超过4400万个3D 房间的数据,具备 “可引导” 的特性,利用了一种名为 “蒙特卡洛树搜索”(Monte Carlo tree search,MCTS)的策略。

近日,麻省理工学院(MIT)的计算机科学与人工智能实验室(CSAIL)与丰田研究院共同推出了一款名为 “可引导场景生成”(steerable scene generation)的生成式 AI 工具,旨在提升机器人学习能力。这款新工具能够创建虚拟训练环境,如厨房、客厅和餐厅,以供工程师测试机器人如何处理现实生活中的任务。

全息投影 机器人设计 (5)

图源备注:图片由AI生成,图片授权服务商Midjourney

该平台经过训练,基于超过4400万个3D 房间的数据,具备 “可引导” 的特性,利用了一种名为 “蒙特卡洛树搜索”(Monte Carlo tree search,MCTS)的策略。MCTS 可以帮助 AI 模型识别并选择场景生成的选项,以实现特定目标,例如让场景尽可能真实,或在场景中添加更多物体。这一策略使得系统在训练过程中能够不断学习,创建出日益复杂的场景。

MIT 的博士生兼 CSAIL 研究员尼古拉斯・帕夫(Nicholas Pfaff)表示,这个项目是首次将 MCTS 应用于场景生成,将场景生成任务视为一种 “序列决策过程”。他说:“我们通过不断构建部分场景,随着时间的推移生成更好或更理想的场景。因此,MCTS 生成的场景比扩散模型训练的场景更为复杂。”

行业专家指出,这项工作可以弥补机器人学习中的一个主要短板,即高质量训练数据的匮乏一直制约着技术的发展。亚马逊机器人应用科学家杰里米・比纳吉亚(Jeremy Binagia)表示:“可引导场景生成提供了更好的方法…… 保证了物理的可行性,并使得生成更加有趣的场景成为可能。”

研究团队表示,他们项目的优势在于能够为工程师创建多样化、可用的场景。帕夫补充道:“借助我们的引导方法,我们能够生成多样化、真实且与任务相一致的场景,从而用于训练我们的机器人。”

尽管该系统仍处于概念验证阶段,团队希望未来能够扩展更多的对象和环境,最终利用生成式 AI 创建全新的资产,而不仅仅依赖于固定的库。通过扩大虚拟训练场的多样性和真实感,团队也希望建立一个用户社区,生成大量数据,为机器人学习更广泛的技能奠定基础。

划重点:

🌐 MIT 与丰田研究院合作推出新 AI 工具,增强机器人虚拟训练能力。  

🤖 新工具利用蒙特卡洛树搜索技术生成复杂场景,推动机器人学习进步。  

📈 未来希望扩展更多对象与环境,建立用户社区支持机器人技能训练。

相关资讯

机器人的「GPT时刻」来了?丰田研究院悄悄做了一场最严谨的VLA验证实验

提到机械臂,第一反应的关键词是「抓取」,高级些的机械臂也就做做冰淇淋和咖啡之类的小任务。 但若要机械臂自主完成繁重且复杂的任务,如布置餐桌、组装自行车,难度便呈指数级上升。 这类任务对感知、理解与动作控制的协同提出了极高要求。
7/21/2025 1:23:00 PM
机器之心

OpenAI 发布首份 ChatGPT AI 影响人类情绪健康研究

OpenAI与MIT Media Lab的研究揭示了AI聊天机器人对用户情感健康的复杂影响,强调了负责任开发和透明化的重要性。研究结果将为AI行业的未来发展提供重要指导,同时提醒用户合理使用AI工具,避免过度依赖。
3/22/2025 12:24:11 PM
故渊

MIT 具身智能达人志

作者 | 赖文昕编辑 | 陈彩娴「伟大的事情从来不是一个人做的,而是由一群人做的。 」智驾向左,具身向右2015 年的一天,赵行走出 MIT的实验室,收到了浙大本科同级朋友董思远的消息,向同样涉足过光学的他了解 CSAIL 里各位教授的具体研究方向,也想到 MIT 里做些 CV 的工作。 两年前,这两位青年从浙大毕业后赴美深造,都围着视觉打转:赵行到 MIT读博,先后师从Ramesh Raskar和Antonio Torralba教授,研究计算成像和多模态学习;董思远到康涅狄格大学读研,师从郑国安,研究傅里叶叠层成像技术。
4/18/2025 11:05:00 AM
赖文昕
  • 1