最近,在欧洲 AI 创业地图上,一笔 1300 万美元的种子轮融资格外醒目:没有发布产品、没有用户数据、甚至没有一行可供调用的 API,SpAItial,仅凭一段展示“文本生成 3D 房间”的短视频,就拿到了 Earlybird、Speedinvest 等顶级基金的下注。
这笔融资背后,是一个尚未成型、但注定重要的赛道:文本生成 3D 世界。
SpAItial 由图形学与 AI 研究者 Matthias Niessner 发起,他此前是 Synthesia 的联合创始人,也在慕尼黑工业大学长期从事视觉计算相关研究。
SpAItial 官网
技术起点:生成一个“可交互”的世界
目前的 AI 图像生成模型,如 OpenAI 的 4o 或 Stable Diffusion,已经可以根据文本生成逼真的静态图像。
相比之下,SpAItial 想要实现的,是生成一个具有物理属性、可以与用户交互的三维空间。Niessner 用“让玻璃杯掉在地上可以碎裂”来描述这种交互性。他表示,目前市场上虽然已有多个团队能生成逼真的 3D 物体,但少有系统能自动构建并模拟整个空间的互动逻辑。
价值1300万美元的文本生成 3D 房间视频
从技术维度看,这不仅涉及 3D 资产建模,还包括物理规则模拟、空间逻辑推理、渲染优化等多环节协同,对算力与架构提出更高要求。
该创业公司的核心团队多来自一线实验室。SpAItial 目前的研发由四位联合创始人组成,除 Niessner 外,还包括:- Ricardo Martin-Brualla,曾参与 Google 旗下 3D 通讯项目 Beam;
- David Novotny,曾在 Meta 负责生成式 3D 资产项目;
- Luke Rogers,负责商业与运营,背景为英国家用车平台 Cazoo 前高管。
官网中的团队列表
团队在过往项目中积累了与生成式建模、图形系统开发相关的实践经验。在融资层面,SpAItial 获得 Earlybird Venture Capital 领投,Speedinvest 及多位个人天使参与。
市场路径:先做基础模型,不直接做应用
SpAItial 并未选择立即推出面向用户的 3D 编辑器或平台产品,而是以构建底层模型为主,计划通过 API 授权方式服务下游开发者。
Niessner 表示,希望通过与少量早期合作方的实际对接,测试模型在不同行业场景中的适应性,并逐步扩展模型的交互能力与物理一致性。
这种路线更接近“模型即服务”的形态:不直接定义应用,而是输出能力,供合作方探索游戏、可视化、建筑设计等场景。
虽然文本生成 3D 空间仍属早期赛道,但已有多个团队切入。
李飞飞 World Labs 官网截图
例如,Fei-Fei Li (李飞飞)创办的 World Labs 聚焦教育与科学可视化领域,估值已超过 10 亿美元;Odyssey 获得 2700 万美元融资,重点在娱乐和虚拟制作方向。
SpAItial 所在的赛道并非空白,但技术与需求尚未完全对齐。部分使用场景(如游戏关卡自动生成)已有明确痛点,但如数字孪生、AR 导览、机器人训练等方向,目前的市场接受度与商业模型仍不明朗。
因此,SpAItial 选择以“能力验证”优先于“用户扩张”为策略,尽可能通过实际使用场景推动模型优化与落地节奏。
Niessner 在采访中强调,团队不会追求快速扩张,目前也未考虑快速招募大规模人员。其核心策略是集中资源,先打磨生成系统的底层架构。
同时,大量训练仍需依赖高性能计算资源,这也是早期资金的主要投入方向之一。
他指出:“我们更关心生成内容的完整性和交互性,而不是模型一次性能生成多少对象。”
当前,3D 内容的主流生产仍高度依赖专业建模软件,如 Blender 或 Autodesk 系列工具,且在游戏引擎层面,Unity 与 Unreal 占据主导地位。
生成式模型是否能提供替代路径,尤其是在结构可控、逻辑闭环的世界构建方面,还需技术与市场的双重推动。