AI在线 AI在线

新兴混合 AI 模型 CausVid:几秒钟内生成高质量视频

近日,麻省理工学院计算机科学人工智能实验室(CSAIL)与 Adobe Research 联合研发的创新性 AI 模型 CausVid 引起了广泛关注。 这一混合模型可以在几秒钟内生成高质量视频,标志着视频创作领域的一次重大技术突破。  创新的技术架构CausVid 的设计理念颠覆了传统的视频生成方式。

近日,麻省理工学院计算机科学人工智能实验室(CSAIL)与 Adobe Research 联合研发的创新性 AI 模型 CausVid 引起了广泛关注。这一混合模型可以在几秒钟内生成高质量视频,标志着视频创作领域的一次重大技术突破。

QQ_1746596970615.png

 创新的技术架构

CausVid 的设计理念颠覆了传统的视频生成方式。许多现有的 AI 视频生成模型通常采用逐帧生成的方式,效率较低,且质量容易下降。而 CausVid 则通过结合全序列扩散模型和自回归模型,实现了同时处理整个视频序列的能力。这种创新的混合技术使得视频生成不仅迅速,而且画面质量得到保障。

具体而言,CausVid 的 “教师模型” 使用经过训练的扩散模型,为更为简单的自回归系统提供指导。自回归系统借助 “教师” 的知识,能够准确预测下一帧画面,从而有效避免了常见的 “错误累积” 问题,确保生成的视频画面流畅且一致。

多样化的创作功能

CausVid 的功能强大且灵活,用户可以通过简单的文本提示来生成视频。例如,用户只需输入 “生成一个人在过马路”,就能看到一个生动的场景。而在生成过程中,用户还可以随时添加新元素,比如 “他到对面人行道时开始写笔记”,使得视频创作更加互动和个性化。

不仅如此,CausVid 还具备将静态图片转化为动态场景的能力,用户可以看到静态的风景照在模型的帮助下,变得栩栩如生。此外,CausVid 还可以用于多种视频编辑任务,例如为外语直播生成同步的翻译视频,或者在视频游戏中快速创建新场景,这使得其应用前景十分广阔。

 优越的性能表现

在多项性能测试中,CausVid 展现了其卓越的能力。研究人员发现,CausVid 能够生成长达10秒的高清视频,且其生成速度是其他基准模型如 OpenSORA 和 MovieGen 的100倍,同时在画质和稳定性方面也取得了显著优势。甚至在生成30秒的视频时,CausVid 依然能够在质量和一致性上超越同类产品,这意味着它有潜力生成更长时间的视频,甚至数小时的内容。

尽管 CausVid 已经表现出色,研究团队表示,未来还有提升的空间。他们希望通过在特定领域数据集上的训练,使得 CausVid 能够在更短的时间内生成更高质量的视频。这一突破不仅会提高视频生成的效率,还可能带来更好的用户体验。

CausVid 的研发得到了亚马逊科学中心、光州科技学院、Adobe、谷歌及美国空军研究实验室的支持。该模型将于六月在计算机视觉与模式识别会议上进行展示,期待它为视频生成技术带来更多可能性。

项目:https://github.com/tianweiy/CausVid

划重点:  

🌟 CausVid 是一个新开发的混合 AI 模型,能够在几秒钟内生成高质量视频。  

⚡ 它结合了全序列扩散模型和自回归模型的优势,实现快速而一致的视频输出。  

🚀 CausVid 在生成视频的速度和质量上均超过了其他现有模型,未来有望实现即时生成。  

相关资讯

AI“恐怖”体操视频腿脚乱飞、大变活人,LeCun:视频生成模型根本不懂物理

一段 AI 生成的体操视频,引发近百万网友围观,LeCun 等一众大佬还因为它吵起来了。体操表演,emmmm 怎么不算呢?通过视频右上角的水印,此段视频正是由那个一度被认为是“下一代”文生视频的 Dream Machine(来自 Luma AI)生成的。大伙儿看后纷纷坐不住,围绕此讨论的,是 AI 视频领域的一个熟悉的话题:AI 是否理解物理规律。LeCun 直接开麦:视频生成模型不理解基本物理知识。更不用说人体了。华盛顿大学计算机科学教授 Pedro Domingos 看后也“摇了摇头”:AGI 可能并不会像一些
7/1/2024 3:40:00 PM
清源

Runway和Luma又打起来了!Yann LeCun炮轰:你们再牛,也不是「世界模型」

机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。   我们也欢迎读者投稿亲自实践的创新型用例。AI 视频界又「打」起来了!6 月 29 日,著名生成式 AI 平台 Runway 宣布,其最新模型 Gen-3 Alpha 向部分用户开启测试。同一天,Luma 推出关键帧新功能,并向所有用户免费开放使用。可谓是「你有张良计,我
7/1/2024 6:34:00 PM
机器之能

美图:“奇想大模型”视频生成能力已完成全面升级,可生成 1 分钟视频

美图公司今天宣布,旗下的“奇想大模型”视频生成能力完成全面升级,在实现生成能力、生成效率以及模型性能的三重进阶基础上,结合美图在计算机视觉领域的多项自研技术,实现了视频生成时长、画质、流畅性、真实性及可信度等方面的提升。据悉,美图奇想大模型的单次文生视频时长、单次图生视频时长均达 5 秒,支持生成 1 分钟、24FPS、1080P 的超长视频,升级后的视频生成功能将逐步覆盖美图秀秀、美颜相机、Wink、开拍、美图设计室、WHEE、MOKI 等产品。据AI在线此前报道,今年 1 月 2 日,美图公司自研 AI 视觉大
9/23/2024 5:12:35 PM
清源
  • 1