AI在线 AI在线

24 帧·720p·无限交互!谷歌 Genie 3 开启“造梦引擎 2.0”

昨天,Google Deepmind推出新一代AI系统Genie 3,能够根据简单文本生成实时互动的3D虚拟世界。 这一模型不仅能构建世界,还能让用户以每秒24帧、720p分辨率的画质在其中自由探索。 与传统视频生成不同,Genie 3采用自回归方式逐帧生成画面,每一帧都会参考多达一分钟内的环境细节。

昨天,Google Deepmind推出新一代AI系统Genie 3,能够根据简单文本生成实时互动的3D虚拟世界。这一模型不仅能构建世界,还能让用户以每秒24帧、720p分辨率的画质在其中自由探索。

24 帧·720p·无限交互!谷歌 Genie 3 开启“造梦引擎 2.0”

与传统视频生成不同,Genie 3采用自回归方式逐帧生成画面,每一帧都会参考多达一分钟内的环境细节。

这种方法显著提升了视觉连续性,生成的世界在交互过程中能够在数分钟内保持物理和视觉一致性

Deepmind表示,这是首个同时实现实时交互与物理连续性的AI世界模型,为发展通用人工智能(AGI)打下了基础。

Genie 3是继Genie 1、Genie 2,以及视频生成器Veo系列之后的又一重要进展。

Deepmind希望将其发展为“基础世界模型”(Foundation World Model),为更高级的智能体系统提供训练平台。

1.AI世界的可塑性与开放性

用户仅需输入文字提示,就能在Genie 3中生成如“火山喷发”“飞行岛屿”或“史前遗迹”等复杂场景。

这些提示不仅能改变场景天气、召唤新物体,还能制造各种“反事实情境”,测试AI智能体在突发情况下的反应。

24 帧·720p·无限交互!谷歌 Genie 3 开启“造梦引擎 2.0”

在一个演示中,镜头从多个角度移动,画面左侧的树木在0:00、0:20和0:40秒的时间节点始终如一,清晰展现出环境的稳定性

Genie 3的独特之处在于,它无需任何预设3D模型或数据,只需文字描述即可构建出稳定世界。

这与NeRF或Gaussian Splatting等依赖已有数据的技术不同,意味着它可以构建更开放、动态的训练环境

Deepmind的SIM智能体(SIMA)已经在这些虚拟世界中进行测试,系统对智能体的目标一无所知,仅对其动作做出反应

这种设置让研究人员能够更真实地模拟AI执行复杂任务的过程,并探索其潜在弱点。

2.从AI研究到游戏引擎的未来

Deepmind称Genie 3目前处于有限研究预览阶段,仅向部分研究人员和创作者开放。

这一做法旨在提前识别风险,为后续发展提供参考。

尽管Genie 3还有一些技术限制,例如交互时长有限、多智能体互动尚不成熟、现实地理位置无法定位等,但它已展示出巨大的潜力。

未来,这一模型可用于教育、模拟训练、专家决策支持等领域,尤其适合复杂情境下的预演和演练

Deepmind CEO Demis Hassabis曾表示,世界模型是实现AGI的关键,因为它们能让AI在无限多样的模拟环境中自主学习。

这一理念也得到AI研究者Richard Sutton和David Silver的支持,他们认为AI的未来应从静态数据转向基于自身经验的学习过程

而Genie 3,正是这一理念的具象体现。

24 帧·720p·无限交互!谷歌 Genie 3 开启“造梦引擎 2.0”

NVIDIA AI总监Jim Fan认为,Genie 3代表着“游戏引擎2.0”的雏形。

他预测,未来的游戏开发将不再依赖复杂的3D素材与场景图,而由数据驱动的AI模型直接生成可交互空间

开发者只需通过提示语进行操作,无需理解图形学、着色器或场景管理等技术细节。

“这将是游戏开发的终局(The End Game),”Jim Fan写道,“全部由提示工程驱动,一切由数据决定,复杂性交由AI处理。”

正如语言模型改变了写作方式,Genie 3有望改变游戏的开发方式,乃至整个虚拟世界的创造范式。

Genie 3不仅是一个AI模型,它是Deepmind对未来世界的实验室

通过它,我们看见了一种可能:人类以语言建造世界,AI在世界中学习行为

相关资讯

谷歌Genie 3突破实时壁垒:24fps生成3D世界,AI游戏时代真正来临

你有没有想过,有一天AI能够像电影特效师一样,仅凭一句话就能实时生成一个完整的、可以游玩的3D世界? 根据最新报道,谷歌DeepMind刚刚发布的Genie 3做到了这一点,而且远远超出了我们的预期。 这不再是技术演示,而是真正可用的交互平台。
8/8/2025 9:15:54 AM
阿丸笔记

3D版Midjourney来了?Luma AI发布Genie 1.0,生成手办只需10秒

机器之心报道机器之心编辑部文生 3D 模型又来新玩家。随着生成式 AI 的浪潮席卷而来,科技公司都在冲击 AIGC 的下一个突破口 —— 3D 生成。目前,文生 3D 在学术界取得了许多新突破。在产业界,无论是像英伟达这样的行业巨头,还是像 Stability AI 这样的中坚力量,都推出了自己的文生 3D 工具。虽然 3D 生成领域一直「卷」到飞起,但是好像一直没有出现一款效果足够惊艳,生成速度足够快的代表性产品。如今,一直致力于 3D 内容生产的 Luma AI 向这一领域发起了挑战。就在昨天,Luma AI
1/15/2024 10:10:00 AM
机器之能

最强 AI 程序员 Genie 砸饭碗:84 秒跑通代码,像人一样思考,团队仅 5 人

继 Devin 之后,又一个 AI 软件工程师被刷屏了 —— 它叫 Genie,号称目前地表最强,已经可以像人一样思考和行动了!那么这个“地表最强”,到底强到什么程度?先来看下评测分数。在权威榜单 SWE-Bench 中,Genie 以解决了 30.07% 问题的成绩夺得榜首。(SWE-Bench 是一个用来评估大模型解决现实中软件问题的基准。)而这个成绩可谓是遥遥领先第二名 19.27%,解锁了提升 SOTA 的最大增幅 —— 57%!至于 Genie 的实际效果,用团队的话来说就是:它可以做到像人类工程师一样解
8/13/2024 2:00:40 PM
汪淼
  • 1