AI在线 AI在线

0产品、0用户、0API!欧洲 AI 创企仅凭 1 段视频狂揽1300万刀

最近,在欧洲 AI 创业地图上,一笔 1300 万美元的种子轮融资格外醒目:没有发布产品、没有用户数据、甚至没有一行可供调用的 API,SpAItial,仅凭一段展示“文本生成 3D 房间”的短视频,就拿到了 Earlybird、Speedinvest 等顶级基金的下注。 这笔融资背后,是一个尚未成型、但注定重要的赛道:文本生成 3D 世界。 SpAItial 由图形学与 AI 研究者 Matthias Niessner 发起,他此前是 Synthesia 的联合创始人,也在慕尼黑工业大学长期从事视觉计算相关研究。

最近,在欧洲 AI 创业地图上,一笔 1300 万美元的种子轮融资格外醒目:没有发布产品、没有用户数据、甚至没有一行可供调用的 API,SpAItial,仅凭一段展示“文本生成 3D 房间”的短视频,就拿到了 Earlybird、Speedinvest 等顶级基金的下注。

这笔融资背后,是一个尚未成型、但注定重要的赛道:文本生成 3D 世界。

SpAItial 由图形学与 AI 研究者 Matthias Niessner 发起,他此前是 Synthesia 的联合创始人,也在慕尼黑工业大学长期从事视觉计算相关研究。

SpAItial 官网SpAItial 官网

技术起点:生成一个“可交互”的世界

目前的 AI 图像生成模型,如 OpenAI 的 4o 或 Stable Diffusion,已经可以根据文本生成逼真的静态图像。

相比之下,SpAItial 想要实现的,是生成一个具有物理属性、可以与用户交互的三维空间。Niessner 用“让玻璃杯掉在地上可以碎裂”来描述这种交互性。他表示,目前市场上虽然已有多个团队能生成逼真的 3D 物体,但少有系统能自动构建并模拟整个空间的互动逻辑。

价值1300万美元的文本生成 3D 房间视频价值1300万美元的文本生成 3D 房间视频

从技术维度看,这不仅涉及 3D 资产建模,还包括物理规则模拟、空间逻辑推理、渲染优化等多环节协同,对算力与架构提出更高要求。

该创业公司的核心团队多来自一线实验室。SpAItial 目前的研发由四位联合创始人组成,除 Niessner 外,还包括:
  • Ricardo Martin-Brualla,曾参与 Google 旗下 3D 通讯项目 Beam;
  • David Novotny,曾在 Meta 负责生成式 3D 资产项目;
  • Luke Rogers,负责商业与运营,背景为英国家用车平台 Cazoo 前高管。

官网中的团队列表官网中的团队列表

团队在过往项目中积累了与生成式建模、图形系统开发相关的实践经验。在融资层面,SpAItial 获得 Earlybird Venture Capital 领投,Speedinvest 及多位个人天使参与。

市场路径:先做基础模型,不直接做应用

SpAItial 并未选择立即推出面向用户的 3D 编辑器或平台产品,而是以构建底层模型为主,计划通过 API 授权方式服务下游开发者。

Niessner 表示,希望通过与少量早期合作方的实际对接,测试模型在不同行业场景中的适应性,并逐步扩展模型的交互能力与物理一致性。

这种路线更接近“模型即服务”的形态:不直接定义应用,而是输出能力,供合作方探索游戏、可视化、建筑设计等场景。

虽然文本生成 3D 空间仍属早期赛道,但已有多个团队切入。

李飞飞 World Labs 官网截图李飞飞 World Labs 官网截图

例如,Fei-Fei Li (李飞飞)创办的 World Labs 聚焦教育与科学可视化领域,估值已超过 10 亿美元;Odyssey 获得 2700 万美元融资,重点在娱乐和虚拟制作方向。

SpAItial 所在的赛道并非空白,但技术与需求尚未完全对齐。部分使用场景(如游戏关卡自动生成)已有明确痛点,但如数字孪生、AR 导览、机器人训练等方向,目前的市场接受度与商业模型仍不明朗。

因此,SpAItial 选择以“能力验证”优先于“用户扩张”为策略,尽可能通过实际使用场景推动模型优化与落地节奏。

Niessner 在采访中强调,团队不会追求快速扩张,目前也未考虑快速招募大规模人员。其核心策略是集中资源,先打磨生成系统的底层架构。

同时,大量训练仍需依赖高性能计算资源,这也是早期资金的主要投入方向之一。

他指出:“我们更关心生成内容的完整性和交互性,而不是模型一次性能生成多少对象。”

当前,3D 内容的主流生产仍高度依赖专业建模软件,如 Blender 或 Autodesk 系列工具,且在游戏引擎层面,Unity 与 Unreal 占据主导地位。

生成式模型是否能提供替代路径,尤其是在结构可控、逻辑闭环的世界构建方面,还需技术与市场的双重推动。

相关资讯

实测打脸!世界第一位AI程序员Devin:20项任务只完成了3项!14项任务彻底失败!网友:实际效果跟商业估值没关系!

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)10个月过去,世界“首位AI程序员”究竟如何了? 近日, Answer.AI 团队中经常试验 AI 开发工具的测试团队秉着“百闻不如一见”的精神,与最受Twitter追捧的编程神器共事了一个月,结果非常惨烈。 “作为 Answer.AI 团队中经常试验 AI 开发工具的一员,Devin 给人的感觉有些不同。
1/24/2025 12:49:55 PM
言征

多重可控插帧视频生成编辑,Adobe这个大一统模型做到了,效果惊艳

本文一作 Maham Tanveer 是 Simon Fraser University 的在读博士生,主要研究方向为艺术视觉生成和创作,此前在 ICCV 发表过艺术字体的生成工作。 师从 Hao (Richard) Zhang, IEEE Fellow, Distinguished Professor, 并担任 SIGGRAPH 2025 Paper Chair. 本文尾作 Nanxuan (Cherry)  Zhao 在 Adobe Research 担任 Research Scientist, 研究方向为多模态可控生成和编辑,有丰富的交叉方向研究经历(图形学 图像 人机交互),致力于开发可以让用户更高效进行设计创作的算法和工具。
2/3/2025 12:16:01 PM
机器之心

Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型

针对视频生成中的运动一致性难题,Meta GenAI团队提出了一个全新框架VideoJAM。 VideoJAM基于主流的DiT路线,但和Sora等纯DiT模型相比,动态效果直接拉满:哪怕变化又大又迅速、动作又复杂的舞蹈,也看起来像真的一样,而且还是两个人同步:像倒立这样的操作,同样可以轻松驾驭:而且不需要额外数据或缩放,就能无缝集成到不同规模的DiT模型当中,带来运动效果的提升。 有网友表示,第一眼看上去就和真的一样,也许到今年年底,我们看不到区别了。
2/10/2025 1:15:00 PM
量子位
  • 1