快手联合推出 Pyramid Flow 开源文生视频 AI 模型：最高 10 秒 768P@24fps，创新金字塔流匹配让推理 tokens 降至 1/4

作者：故渊 2024-10-12 09:28

由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型，用户在输入文本之后，即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等，提供更高效、更灵活的视频生成解决方案，目前已经在 Hugging Face 平台上线，并完全开源。 AI在线查询官方介绍，附上 Pyramid Flow 的核心特点如下：高效生成：Pyramid Flow 采用新技术，通过统一 AI 模型分阶段生成视频，大多数阶段为低分辨率，只有最后阶段为全分辨率。

由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型，用户在输入文本之后，即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。

Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等，提供更高效、更灵活的视频生成解决方案，目前已经在 Hugging Face 平台上线，并完全开源。

AI在线查询官方介绍，附上 Pyramid Flow 的核心特点如下：

高效生成：Pyramid Flow 采用新技术，通过统一 AI 模型分阶段生成视频，大多数阶段为低分辨率，只有最后阶段为全分辨率。这种“金字塔流匹配”方法保持了视频的高视觉质量前提下，大幅降低了计算成本，tokens 数量是传统 diffusion 模型的四分之一。
快速推理：在推理过程中，该模型可以在 56 秒内生成一个 5 秒、384p 的视频，速度媲美许多全序列 diffusion 模型，甚至更快。
开源和商业使用：Pyramid-Flow 在 MIT 许可证下发布，允许广泛的使用，包括商业应用、修改和再分发，吸引了希望将模型集成到专有系统中的开发者和公司。

AI在线附上参考地址

Pyramidal Flow Matching for Efficient Video Generative Modeling
New high quality AI video generator Pyramid Flow launches — and it’s fully open source!
Hugging Face
Github
Pyramidal Flow Matching for Efficient Video Generative Modeling

相关标签：

Flow Pyramid

史上首个实时AI视频生成技术：DiT通用，速度提升10.6倍

DiT 都能用，生成视频无质量损失，也不需要训练。实时 AI 视频生成来了！本周三，新加坡国立大学尤洋团队提出了业内第一种可以实时输出的，基于 DiT 的视频生成方法。该技术名为 Pyramid Attention Broadcast （PAB）。通过减少冗余注意力计算，PAB 实现了高达 21.6 FPS 的帧率和 10.6 倍的加速，同时不会牺牲包括 Open-Sora、Open-Sora-Plan 和 Latte 在内的流行基于 DiT 的视频生成模型的质量。值得注意的是，作为一种不需要训练的方法，PAB 可

6/28/2024 2:55:00 PM 机器之心

谷歌发布Flow AI剪辑工具：Veo3 与Imagen4 驱动、镜头控制与场景扩展

在2025年5月20日的Google I/O开发者大会上，谷歌正式推出了全新AI驱动的视频剪辑工具Flow，专为影视创作者打造。 Flow整合了谷歌最先进的生成式AI模型——Veo3、Imagen4和Gemini，旨在通过自然语言提示和模块化工作流，简化视频创作过程，助力专业人士和初学者实现电影级视觉叙事。整合三大AI模型，生成电影级视频Flow的核心在于其结合了Veo3的视频生成、Imagen4的图像生成以及Gemini的自然语言处理能力。

5/21/2025 10:01:45 AM AI在线

逆天改命！Flow-GRPO 让图像生成模型秒变 “大神”

家人们，今天必须给你们唠唠科研界的一项超酷新成果 ——Flow-GRPO!这东西可不得了，它就像是给图像生成模型打了一针 “超级进化剂”，直接让它们从 “青铜” 一路飙升到 “王者”。想知道它是怎么做到的吗?快搬好小板凳，听我细细道来!图像生成模型的 “成长烦恼”现在的图像生成模型，比如基于流匹配（Flow matching）的那些，理论基础那叫一个扎实，生成的高质量图像也让人眼前一亮。但它们也有自己的 “小烦恼”，遇到复杂场景，像要安排好多物体、处理各种属性和关系，或者是在图像里准确渲染文本的时候，就有点 “抓瞎” 了。

5/14/2025 11:00:52 AM AI在线

快手联合推出 Pyramid Flow 开源文生视频 AI 模型：最高 10 秒 768P@24fps，创新金字塔流匹配让推理 tokens 降至 1/4

相关资讯

史上首个实时AI视频生成技术：DiT通用，速度提升10.6倍

谷歌发布Flow AI剪辑工具：Veo3 与Imagen4 驱动、镜头控制与场景扩展

逆天改命！Flow-GRPO 让图像生成模型秒变 “大神”