AI在线 AI在线

国产文生视频大模型 Vidu 发布 1.5 版本更新:可保证多不同视角下的一致性

国产文生视频大模型厂商Vidu昨日宣布,Vidu 1.5新版本正式上线,其实现了“世界领先水平”的突破——能够理解多样化的输入,突破“一致性”的难题。
感谢国产文生视频大模型厂商 Vidu 昨日宣布,Vidu 1.5 新版本正式上线,其实现了“世界领先水平”的突破 —— 能够理解多样化的输入,突破“一致性”的难题。

Vidu 方面称,其在上线之初就已具备角色一致性生成能力,通过锁定人物面部特征可解决视频生成的关键痛点,确保了人物面部特征的一致性。此次发布的更新中,Vidu 则首次展现了上下文学习的能力,提升了整体视频模型的可控性,通过灵活的多元输入实现了多角度、多主体、多元素的一致性生成。

AI在线获悉,其在三个方面直观呈现了“技术突破”:

  • 复杂主体的精准控制:无论是细节丰富的角色,还是复杂的物体,Vidu 都能保证其在多个不同视角下的一致性。如造型复杂的 3D 动画风格角色,无论视角如何变化,其能够始终确保头型、服饰的全角度细节一致,避免了传统视频模型在复杂视角切换时产生的瑕疵。

  • 人物面部特征和动态表情的自然一致:在人物特写镜头中,其能够自然且流畅地保持人物面部特征和表情的连贯性,避免了面部僵硬或失真的现象

  • 多主体一致性:用户可上传多个主题图像,包括人物角色、道具物体、环境背景等,并在视频生成中实现这些元素的交互。例如,用户可以上传主体、客体和环境的图片,创建定制角色身穿特定服装、在定制空间内自由动作的场景。

相关资讯

我在模拟世界!OpenAI刚刚公布Sora技术细节:是数据驱动物理引擎

机器之心报道机器之心编辑部先安排好演员,再让他们来演绎。今天,我们都在感受 Sora 的带来的魅力。OpenAI 的首个视频生成模型 Sora,让「一句话生成视频」的前沿 AI 技术向上突破了一大截,引发了业界对于生成式 AI 技术方向的大讨论。Sora 生成的视频范例。提示词:「两艘海盗船在一个咖啡杯中航行、互相战斗的逼真特写视频。」来源:,我们已经见证过许多创业公司提出的视频生成模型。相比之下,OpenAI 提出的新模型不论是效果还是理念上,似乎都具有划时代的意义。有人第一时间总结道,Sora 不是一个简单的视
2/16/2024 5:34:00 PM
机器之能

快手「可灵」爆火:海外AI圈巨震,中国版Sora一号难求

短短一年后,AI 生成的「吃面条」已经如此自然流畅?这让全球网友都感受到了亿点点震撼。                            图源:,都来自快手刚刚推出的文生视频大模型「可灵」(Kling)。不是预发布、不是纯 Demo 合集,而是直接开放测试的产品级应用,人人都能申请。而且,可灵支持生成最长 2 分钟、30fps 的 1080P 视频,主打从头脑风暴到可发布作品的「一键转化」。(官网地址:)最早一批用上的用户已经「真香」:                              图源:     
6/13/2024 11:28:00 AM
机器之心

这个AI小玩物,让马斯克、川建国秒变「缺心眼子」粘土人

机器之能报道编辑:杨文五官乱飞的大佬们,原来这么有喜感。简单且有趣的 AI 小应用极容易出圈,比如说曾经风靡一时的妙鸭相机、粘土滤镜。最近,有人做了一个 iPhone app,只需要一张自拍照,就能生成一段挤眉弄眼的卡通视频。例如,眼皮乱耷拉的搞怪版梁龙:视频链接::实时自定义表情的美女:这个小玩意儿就是 ——Cooraft。目前,Cooraft 这款应用只支持苹果系统,苹果手机和 ipad 用户可在苹果商城下载。今天我们就来体验一下。-1-马斯克、川建国的眉毛要上天Cooraft 提供三种功能,分别是脸部动画、风
7/26/2024 10:10:00 AM
机器之能
  • 1