AI在线 AI在线

刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代

就在今天,斯坦福大学教授李飞飞的创业公司 World Labs 发布了新成果 —— 限量开放的测试预览版空间智能模型 Marble。 「只需一张图片,就能生成持久存在的 3D 世界,比以往更宏大、更震撼! 」我们先看下面一段视频 demo: 李飞飞对此表示,「这是一个使用我们的 3D 世界生成模型创建的极其庞大的世界,它令我惊叹不已!

就在今天,斯坦福大学教授李飞飞的创业公司 World Labs 发布了新成果 —— 限量开放的测试预览版空间智能模型 Marble。

「只需一张图片,就能生成持久存在的 3D 世界,比以往更宏大、更震撼!」

刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代

我们先看下面一段视频 demo:

刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代

李飞飞对此表示,「这是一个使用我们的 3D 世界生成模型创建的极其庞大的世界,它令我惊叹不已!」

实现这一切,输入的既可以是单张图片,也可以是文本提示。

刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代

当被问到与谷歌的 Genie 有什么区别时,李飞飞表示,「我们生成的 3D 世界是永久存在的,用户可以自由地在其中导航探索,而这一切对你来说完全免费。」

刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代

有 X 博主表示,「这才是真正的大规模 3D 生成。」

刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代

另有网友测试后表示效果很棒,也提出了一些改进的建议。

刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代

目前,用户可以加入白名单,访问 Marble 预览版。

刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代

白名单地址:https://www.worldlabs.ai/waitlist

在 World Labs 放出的官方博客中,我们可以看到更详细的技术细节(下文以第一人称陈述)。

今天,我们很高兴分享在「空间智能」前沿探索上的最新进展 —— 生成持久、可导航、可控的 3D 世界。

同时,我们正式推出 Marble,一个限量测试版预览模型,现已开放试用。

刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代

试用地址:marble.worldlabs.ai

无论是输入一张图片还是一段文字提示,Marble 都能生成一个 3D 世界,供你无限制地探索 —— 没有时间限制、没有形变、没有不一致性。

与此前成果相比,现在生成的 3D 世界规模更大、风格更多样化、几何结构也更为干净。

Marble 让用户可以浏览和构建 3D 世界。爱好者和开发者还可以将生成的世界导出为高斯点云,并在下游项目中加以使用。这在开源渲染库 Spark 的支持下尤为方便,它能够将高斯点云无缝集成进 Three.js,用于构建基于 Web 的 3D 体验,并能高效地在桌面电脑、笔记本电脑、移动设备和 VR 头显上运行。

凭借模型在一致性和风格遵循上的进步,用户现在可以通过组合多个单独的生成结果来构建出更大的世界。

更优质的几何结构

在许多视觉创作者的工作流与应用场景中,能够在一致的 3D 世界中进行导航和交互是核心需求。

我们生成的 3D 世界支持用户在浏览器中进行自由视角的导航,且完全零成本。相比深度图或点云所提供的有限 3D 体验,我们的世界具备更丰富的几何复杂度,能够生成更完整的 3D 场景,使用户可以从输入视角的背后或更远处进行探索。

目前,我们的模型主要面向 3D 环境的创建,而不是聚焦于单个或中心对象(例如人物或动物)。所以,对于自拍爱好者或宠物主人来说,暂时可能会有些遗憾。

刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代

刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代

更多样化的风格

生成式 AI 最令人兴奋的一点,是它能在创作过程中自由迭代外观与风格。

我们的模型可以将各种风格的输入转化为 3D 世界,从平面、色彩鲜明的卡通到逼真、细节丰富的图像,让用户能够不断探索和尝试,找到最契合需求的 3D 世界。

刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代

更宏大场景的探索

以房间大小为尺度的世界是一个很好的起点,但创作者的想象往往超越这些界限。

我们想展示一些可能性:用户可以将自己生成的空间拼接在一起,从而构建更宏大的环境。得益于我们的模型在风格一致性和几何一致性上的表现,如今已经可以畅快地在这些更大的世界中进行导航和浏览,并设想出丰富多样的应用场景。

刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代

博客地址:https://www.worldlabs.ai/blog/bigger-better-worlds

相关资讯

只需一张图片、一句动作指令,Animate124轻松生成3D视频

Animate124,轻松将单张图片变成 3D 视频。近一年来,DreamFusion 引领了一个新潮流,即 3D 静态物体与场景的生成,这在生成技术领域引发了广泛关注。回顾过去一年,我们见证了 3D 静态生成技术在质量和控制性方面的显著进步。技术发展从基于文本的生成起步,逐渐融入单视角图像,进而发展到整合多种控制信号。与此相较,3D 动态场景生成仍处于起步阶段。2023 年初,Meta 推出了 MAV3D,标志着首次尝试基于文本生成 3D 视频。然而,受限于开源视频生成模型的缺乏,这一领域的进展相对缓慢。然而,现
12/21/2023 2:28:00 PM
机器之心

PartCrafter:首个结构化3D多部件生成模型

本篇文章是北京大学、字节跳动和卡耐基梅隆大学的联合工作。 我们提出了 PartCrafter,一种新颖的结构化 3D 生成模型,为 3D 对象创建引入了一种变革性的方法。 PartCrafter 不仅能生成可分解的 3D 网格,还支持灵活的部件编辑,为创作者提供了更高的自由度。
8/14/2025 1:37:36 PM
潘攀望

不到60秒就能生成3D「手办」,Meta发力3D生成,ChatGPT时刻要来了吗?

3D 生成,一直在等待它的「ChatGPT时刻」。一直以来,创作 3D 内容是设计和开发视频游戏、增强现实、虚拟现实以及影视特效中最重要的部分。然而,3D 生成具有独特而艰巨的挑战,这是图像和视频等其他生成内容所不具备的。首先,3D 内容在艺术质量、生成速度、3D 网格结构和拓扑质量、UV 贴图结构以及纹理清晰度和分辨率方面具有严格的标准;其次,与其他研究相比,可用的数据量少。虽然该领域有数十亿张图像和视频可供学习,但可用于训练的 3D 内容数量要少三到四个数量级。因此,现阶段的3D 生成还必须从非 3D 的图像和
7/4/2024 5:55:00 PM
机器之心
  • 1