AI在线 AI在线

谷歌 DeepMind 推出新技术:无 3D 模型也能生成真实运动视频

近日,谷歌 DeepMind 团队与布朗大学合作,开发了一项名为 “力提示”(force prompting)的新技术。 这项技术能够在没有3D 模型和物理引擎的情况下,生成逼真的运动效果,标志着人工智能视频生成领域的一大突破。 使用这项技术,用户只需简单地指定力的方向和强度,就可以操控 AI 生成的视频内容。

近日,谷歌 DeepMind 团队与布朗大学合作,开发了一项名为 “力提示”(force prompting)的新技术。这项技术能够在没有3D 模型和物理引擎的情况下,生成逼真的运动效果,标志着人工智能视频生成领域的一大突破。

image.png

使用这项技术,用户只需简单地指定力的方向和强度,就可以操控 AI 生成的视频内容。力提示技术可以应用于全局力(例如:整体风力)和局部力(如:特定点的敲击)两种情况。输入的力量以矢量场的形式进入系统,随后被转换为自然流畅的运动,极大地提高了视频生成的真实感和动态表现。

研究团队基于 CogVideoX-5B-IV 视频模型,并加入 ControlNet 模块来处理物理控制数据。整个信号通过 Transformer 架构生成视频,每段视频由49帧组成,而训练过程只用了4台 Nvidia A100GPU,训练时间仅为一天。

值得注意的是,训练数据完全来源于合成,包括1.5万段不同风力下旗帜飘动的视频和1.2万段滚动球体、1.1万段花朵受冲击反应的视频。这些丰富的合成数据让模型能够在生成过程中,利用文本描述中的 “风” 或 “气泡” 等物理术语,自动建立正确的力与运动关系。

虽然训练数据的量相对有限,但模型展示出了强大的泛化能力,能够适应新物体、材质和场景,甚至掌握了一些简单的物理规则,比如在相同力量下,轻物体移动的距离远于重物。

用户测试显示,力提示技术在运动匹配度和真实感方面优于仅依赖文本或运动路径控制的基准模型,并且在质量上超越了基于真实物理模拟的 PhysDreamer。不过,在复杂场景中仍然存在一些不足之处,例如烟雾有时无法正确受到风力的影响,人体手臂的运动偶尔显得像布料般轻盈。

DeepMind 的首席执行官 Demis Hassabis 表示,下一代 AI 视频模型(如 Veo3)正逐步理解物理规则,不再局限于文本或图像处理,而是开始表征世界的物理结构。这被认为是迈向更通用 AI 的重要一步,未来的 AI 有望通过经验学习,在模拟环境中不断优化和提升能力。

项目页:https://force-prompting.github.io/

划重点:

🌟 新技术 “力提示” 可生成真实运动视频,无需3D 模型或物理引擎。  

⚙️ 用户通过简单的力的方向和强度操作,实现自然流畅的运动表现。  

📈 模型展现出强大的泛化能力,能够适应新场景和物体。

相关资讯

法庭惊现 AI 虚拟发言人,74 岁创业者引发法官愤怒

近日,在纽约州最高法院,一位74岁的创业者杰罗姆・德瓦尔(Jerome Dewald)因其在法庭上播放的 AI 生成视频而引发了法官的强烈不满。 德瓦尔因与保险公司大都会人寿(MassMutual Metro)之间的劳动争议而出庭,他希望通过一个虚拟的 AI 头像来代表自己发言。 然而,这一尝试却没有得到法官的认可,反而激怒了法官。
4/14/2025 12:01:17 PM
AI在线

Adobe 投资英国AI视频公司 Synthesia

近日,英国初创公司 Synthesia 凭借在企业 AI 生成视频领域的杰出表现,成功获得了 Adobe 的战略投资。 自成立以来,Synthesia 在 AI 视频化身技术上不断创新,目前已成为行业的领军者。 据悉,Synthesia 的年度经常性收入已突破1亿美元,成为众多企业视频解决方案的首选。
4/17/2025 9:01:05 AM
AI在线

智谱清影与AI角色创作平台“捏Ta”开展多模态合作 推动IP一致性落地

2月19日,北京智谱华章科技有限公司宣布,其旗下的多模态创作平台“清影”与AI角色创作平台“捏Ta”达成战略合作,共同探索AI角色设计到动画创作的完整路径,并推动IP一致性的技术落地。 此次合作旨在深入挖掘二次元用户需求与AI应用场景,为用户提供更高质量的生成效果和更快的推理速度。 “清影”基于智谱最新升级的视频生成大模型CogVideoX-2,在模型结构、训练方法和数据工程上进行了全面更新,图生视频基础模型能力大幅提升38%。
2/20/2025 8:55:00 AM
AI在线
  • 1