AI在线 AI在线

​清华开源 TurboDiffusion:AI 视频生成步入“秒级”时代,最高提速达 200 倍

近日,清华大学 TSAIL 实验室联合生数科技推出了全新的开源视频生成加速框架TurboDiffusion。 这一突破性的技术框架在确保视频生成质量不减的前提下,成功将端到端扩散生成的推理速度提升了100至200倍。 AIbase 获悉,该框架为了实现极致的生成效率,集成了 SageAttention 和 SLA(稀疏线性注意力机制)。

近日,清华大学 TSAIL 实验室联合生数科技推出了全新的开源视频生成加速框架TurboDiffusion。这一突破性的技术框架在确保视频生成质量不减的前提下,成功将端到端扩散生成的推理速度提升了100至200倍。

image.png

AIbase 获悉,该框架为了实现极致的生成效率,集成了 SageAttention 和 SLA(稀疏线性注意力机制)。这些技术显著降低了模型在处理高分辨率视频内容时的计算开销。此外,开发团队还引入了 rCM(时间步蒸馏)技术,通过大幅减少扩散过程中的采样步数,让视频生成在保持视觉一致性的同时,实现了极低的计算延迟。

根据GitHub公布的实测数据,TurboDiffusion 的加速表现令人震惊。在单张 RTX5090显卡上,原本生成5秒视频需要184秒,而使用该框架后仅需1.9秒即可完成。对于参数量更大的模型,其提升更为显著:原本耗时约1.2小时的720P 视频生成任务,现在被压缩到了短短38秒,性能远超目前市面上的同类加速方案。

image.png

目前,TurboDiffusion 已开源并提供了多种规格的模型权重供用户下载。针对消费级显卡(如 RTX4090/5090)和工业级显卡(如 H100),团队分别提供了量化版与非量化版的优化方案。这意味着无论是个人创作者还是企业级用户,都能通过这一工具显著提升 AI 视频的生产效率。

github:https://github.com/thu-ml/TurboDiffusion

划重点:

  • 效能飞跃:清华开源框架将 AI 视频生成提速最高200倍,RTX5090显卡可实现1.9秒产出5秒视频。

  • 🛠️ 技术核心:通过 SageAttention、稀疏线性注意力机制以及时间步蒸馏技术,在不损耗画质的情况下大幅削减算力需求。

  • 🌐 全面适配:框架已开放模型权重,并针对不同显存容量的显卡提供了量化优化方案,极大降低了高性能 AI 视频生成的门槛。

相关资讯

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
10/19/2024 9:25:00 PM 机器之心
​生数科技与清华大学联合推出 TurboDiffusion 视频生成加速框架

​生数科技与清华大学联合推出 TurboDiffusion 视频生成加速框架

近日,生数科技与清华大学的 TSAIL 实验室共同发布了一个名为 TurboDiffusion 的视频生成加速框架,并将其开源。 这个新框架的发布引起了广泛关注,许多人期待它能为视频生成技术带来突破性进展。 根据官方介绍,TurboDiffusion 在几乎不影响生成质量的情况下,能够实现最高达200倍的视频生成推理加速。
12/23/2025 5:56:33 PM AI在线
清华开源TurboDiffusion,AI视频生成速度暴增200倍,消费级显卡也能秒出大片!

清华开源TurboDiffusion,AI视频生成速度暴增200倍,消费级显卡也能秒出大片!

近日,清华大学TSAIL实验室联合生数科技正式开源视频生成加速框架TurboDiffusion,这一突破性技术将AI视频扩散模型的推理速度提升100至200倍,同时保持视觉质量几乎无损,标志着AI视频创作正式进入实时生成时代。 加速性能惊人:从分钟级到秒级生成TurboDiffusion针对现有开源视频生成模型(如Wan2.1和Wan2.2系列的1.3B至14B参数模型)进行了深度优化。 在单张RTX5090显卡上,端到端生成速度可达峰值200倍以上。
12/25/2025 2:56:40 PM AI在线