0产品、0用户、0API！欧洲 AI 创企仅凭 1 段视频狂揽1300万刀

作者： 2025-06-09 02:00

最近，在欧洲 AI 创业地图上，一笔 1300 万美元的种子轮融资格外醒目：没有发布产品、没有用户数据、甚至没有一行可供调用的 API，SpAItial，仅凭一段展示“文本生成 3D 房间”的短视频，就拿到了 Earlybird、Speedinvest 等顶级基金的下注。这笔融资背后，是一个尚未成型、但注定重要的赛道：文本生成 3D 世界。 SpAItial 由图形学与 AI 研究者 Matthias Niessner 发起，他此前是 Synthesia 的联合创始人，也在慕尼黑工业大学长期从事视觉计算相关研究。

最近，在欧洲 AI 创业地图上，一笔 1300 万美元的种子轮融资格外醒目：没有发布产品、没有用户数据、甚至没有一行可供调用的 API，SpAItial，仅凭一段展示“文本生成 3D 房间”的短视频，就拿到了 Earlybird、Speedinvest 等顶级基金的下注。

这笔融资背后，是一个尚未成型、但注定重要的赛道：文本生成 3D 世界。

SpAItial 由图形学与 AI 研究者 Matthias Niessner 发起，他此前是 Synthesia 的联合创始人，也在慕尼黑工业大学长期从事视觉计算相关研究。

SpAItial 官网

技术起点：生成一个“可交互”的世界

目前的 AI 图像生成模型，如 OpenAI 的 4o 或 Stable Diffusion，已经可以根据文本生成逼真的静态图像。

相比之下，SpAItial 想要实现的，是生成一个具有物理属性、可以与用户交互的三维空间。Niessner 用“让玻璃杯掉在地上可以碎裂”来描述这种交互性。他表示，目前市场上虽然已有多个团队能生成逼真的 3D 物体，但少有系统能自动构建并模拟整个空间的互动逻辑。

价值1300万美元的文本生成 3D 房间视频

从技术维度看，这不仅涉及 3D 资产建模，还包括物理规则模拟、空间逻辑推理、渲染优化等多环节协同，对算力与架构提出更高要求。

该创业公司的核心团队多来自一线实验室。SpAItial 目前的研发由四位联合创始人组成，除 Niessner 外，还包括：

Ricardo Martin-Brualla，曾参与 Google 旗下 3D 通讯项目 Beam；
David Novotny，曾在 Meta 负责生成式 3D 资产项目；
Luke Rogers，负责商业与运营，背景为英国家用车平台 Cazoo 前高管。

官网中的团队列表

团队在过往项目中积累了与生成式建模、图形系统开发相关的实践经验。在融资层面，SpAItial 获得 Earlybird Venture Capital 领投，Speedinvest 及多位个人天使参与。

市场路径：先做基础模型，不直接做应用

SpAItial 并未选择立即推出面向用户的 3D 编辑器或平台产品，而是以构建底层模型为主，计划通过 API 授权方式服务下游开发者。

Niessner 表示，希望通过与少量早期合作方的实际对接，测试模型在不同行业场景中的适应性，并逐步扩展模型的交互能力与物理一致性。

这种路线更接近“模型即服务”的形态：不直接定义应用，而是输出能力，供合作方探索游戏、可视化、建筑设计等场景。

虽然文本生成 3D 空间仍属早期赛道，但已有多个团队切入。

李飞飞 World Labs 官网截图

例如，Fei-Fei Li （李飞飞）创办的 World Labs 聚焦教育与科学可视化领域，估值已超过 10 亿美元；Odyssey 获得 2700 万美元融资，重点在娱乐和虚拟制作方向。

SpAItial 所在的赛道并非空白，但技术与需求尚未完全对齐。部分使用场景（如游戏关卡自动生成）已有明确痛点，但如数字孪生、AR 导览、机器人训练等方向，目前的市场接受度与商业模型仍不明朗。

因此，SpAItial 选择以“能力验证”优先于“用户扩张”为策略，尽可能通过实际使用场景推动模型优化与落地节奏。

Niessner 在采访中强调，团队不会追求快速扩张，目前也未考虑快速招募大规模人员。其核心策略是集中资源，先打磨生成系统的底层架构。

同时，大量训练仍需依赖高性能计算资源，这也是早期资金的主要投入方向之一。

他指出：“我们更关心生成内容的完整性和交互性，而不是模型一次性能生成多少对象。”

当前，3D 内容的主流生产仍高度依赖专业建模软件，如 Blender 或 Autodesk 系列工具，且在游戏引擎层面，Unity 与 Unreal 占据主导地位。

生成式模型是否能提供替代路径，尤其是在结构可控、逻辑闭环的世界构建方面，还需技术与市场的双重推动。

实测打脸！世界第一位AI程序员Devin：20项任务只完成了3项！14项任务彻底失败！网友：实际效果跟商业估值没关系！

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）10个月过去，世界“首位AI程序员”究竟如何了？近日， Answer.AI 团队中经常试验 AI 开发工具的测试团队秉着“百闻不如一见”的精神，与最受Twitter追捧的编程神器共事了一个月，结果非常惨烈。 “作为 Answer.AI 团队中经常试验 AI 开发工具的一员，Devin 给人的感觉有些不同。

1/24/2025 12:49:55 PM 言征

多重可控插帧视频生成编辑，Adobe这个大一统模型做到了，效果惊艳

本文一作 Maham Tanveer 是 Simon Fraser University 的在读博士生，主要研究方向为艺术视觉生成和创作，此前在 ICCV 发表过艺术字体的生成工作。师从 Hao (Richard) Zhang, IEEE Fellow, Distinguished Professor, 并担任 SIGGRAPH 2025 Paper Chair. 本文尾作 Nanxuan (Cherry) Zhao 在 Adobe Research 担任 Research Scientist, 研究方向为多模态可控生成和编辑，有丰富的交叉方向研究经历（图形学图像人机交互），致力于开发可以让用户更高效进行设计创作的算法和工具。

2/3/2025 12:16:01 PM 机器之心

Meta新视频生成框架拿捏倒立杂技，双人舞也能完美同步！运动一致性暴增近20%，可无缝集成DiT模型

针对视频生成中的运动一致性难题，Meta GenAI团队提出了一个全新框架VideoJAM。 VideoJAM基于主流的DiT路线，但和Sora等纯DiT模型相比，动态效果直接拉满：哪怕变化又大又迅速、动作又复杂的舞蹈，也看起来像真的一样，而且还是两个人同步：像倒立这样的操作，同样可以轻松驾驭：而且不需要额外数据或缩放，就能无缝集成到不同规模的DiT模型当中，带来运动效果的提升。有网友表示，第一眼看上去就和真的一样，也许到今年年底，我们看不到区别了。

2/10/2025 1:15:00 PM 量子位