AI在线 AI在线

AI视频生成走向“演技生成”时代,生数科技Vidu全球发布Vidu Q2

9月25日,生数科技正式发布新一代图生视频大模型Vidu Q2。 新模型以”Vidu Q2 看AI演戏"为主题,“细微表情生成”为核心提升场景,在极致表情变化、推拉运镜、生成速度及语义理解方面取得的突破性进展,实现从“生成视频”到“生成演技”,从“动态流畅”到“情感表达”的革命性跨越,标志着AI视频生成技术正式从追求“形似”进入追求“神似”的新阶段,将为内容创作、影视产业、广告营销等领域带来全新升级。 本次更新的Vidu Q2主要包括图生视频、首尾帧视频、时长可选(2-8s)、电影大片及闪电出片两种模式,在复杂表情变化的文戏,常见的多人打斗场景的武戏,及影视剧情中令人震撼的炫酷特效中表现出彩,能够通过媲美人类的AI真实表演,将AI演技强力渗透影视、短视频剧情创作、广告创意等生产力场景,推动AI视频生成主角从原本僵硬、机械、无感情的“AI木头”提升为灵动、有情感、会演戏“AI人”。

9月25日,生数科技正式发布新一代图生视频大模型Vidu Q2。新模型以”Vidu Q2 看AI演戏"为主题,“细微表情生成”为核心提升场景,在极致表情变化、推拉运镜、生成速度及语义理解方面取得的突破性进展,实现从“生成视频”到“生成演技”,从“动态流畅”到“情感表达”的革命性跨越,标志着AI视频生成技术正式从追求“形似”进入追求“神似”的新阶段,将为内容创作、影视产业、广告营销等领域带来全新升级。

本次更新的Vidu Q2主要包括图生视频、首尾帧视频、时长可选(2-8s)、电影大片及闪电出片两种模式,在复杂表情变化的文戏,常见的多人打斗场景的武戏,及影视剧情中令人震撼的炫酷特效中表现出彩,能够通过媲美人类的AI真实表演,将AI演技强力渗透影视、短视频剧情创作、广告创意等生产力场景,推动AI视频生成主角从原本僵硬、机械、无感情的“AI木头”提升为灵动、有情感、会演戏“AI人”。

突破技术壁垒,AI视频从“能动”到“会演”

当前,AI视频生成已能实现基本的动作连贯,但生成的角色往往表情僵硬、眼神空洞,缺乏细节和打动人心的情感表达,AI生成视频中的角色也常被诟病为“面瘫”或表情僵化,这成为制约AI行业规模化发展的关键瓶颈。

Vidu Q2的诞生,正是为了突破这一“最后一道壁垒”。它能够理解并生成极其细腻的面部微表情,例如嘴角不经意的抽动、眼神中一闪而过的犹豫、眉头微蹙表达的疑虑等。这些细微、短暂且不受意识控制的表情,是人类传递复杂、真实情感的关键。Vidu Q2在细微表情生成中的成功技术攻克,使数字角色能够展现出生动且充满感染力的演技。

AI视频生成走向“演技生成”时代,生数科技Vidu全球发布Vidu Q2

Vidu Q2 宣传海报

生数科技首席执行官骆怡航表示,“Vidu Q2的突破在于我们首次让AI角色拥有了‘有趣的灵魂’。我们教会了AI‘演戏’,这不仅是技术的里程碑,更是通向更高级别人工智能不可或缺的一步。”

这一突破得益于Vidu Q2在多模态理解与生成技术上的深度融合。模型通过深度理解情感文本、图文解析,并结合对人体面部动作单元的精细解构与物理模拟,从而在视频中驱动角色面部肌肉、肢体肌肉产生符合情感逻辑的细微运动。除了微表情,Vidu Q2在生成可控及一致性等方面也有了多方位超越。

构建高效能产品矩阵,多场景应用效能跃升 

在突破性的“演技”能力之下,Vidu Q2将AI化身演技派 ,构建了一套面向实际应用的高效能产品矩阵。本次发布的首尾帧、双出片模式及2-8秒筛选等兼顾出片质量与效率的产品设计模式,网页版、App版及API同步上线的多渠道化,使得Vidu Q2能够灵活适配从高端影视制作到快速社交媒体内容生产的不同需求,并让用户与客户都能快速体验。

以“更大的幅度 × 更牛的运镜 × 更快的速度 = Vidu Q2”的创作效率革命公式,在实际应用中,Vidu Q2展现出强大的场景适应性。在需要细腻情感表达的“感情”中,它能精准刻画角色的内心冲突;在复杂的“动作”多人打斗场景中,它能确保每个角色的动作流畅且表情到位;而在需要视觉冲击力的特效场景中,它更能生成与角色表演完美融合的炫酷效果。这种全方位的表现,使其成为一个真正意义上的“全能型”创作伙伴。

引领人机协作  赋能每一个故事讲述者

Vidu Q2的发布,标志着内容创作范式的一次根本性转移。它并非简单的工具迭代,而是作为“表演主体”重新定义了AI在创作链中的角色。这意味着,创意生产的核心模式将从“人执行”转向“人指导”,创作者得以从繁琐的实现过程中解放,将精力专注于最核心的创意与审美。

随着技术的持续演进,生数科技Vidu Q2正在开启一个“人机共创”的新纪元:AI负责精准、高效地完成“表演”,人类则扮演“总导演”的角色,把控故事的灵魂与情感表达。这种深度协作将极大释放生产力,催生此前难以想象的创意形式,推动AI逐步深入电影预演、虚拟人交互等更复杂的工业流程,由AI承担表演、人类主导创意的协作模式,必将释放出更大的想象空间与商业价值。

相关资讯

AI视频生成走向「演技生成」时代,生数科技Vidu全球发布Vidu Q2

当 AI 视频不再只像过去那样比拼高清像素,而是开始进入 “飙演技” 阶段,AI 视频才算正式迈入内容生产的最高级形式 —— 影视级叙事新阶段。 9 月 25 日,生数科技新一代图生视频大模型 Vidu Q2 正式全球上线,打破了原有 AI 生成的表情太假,动作飘忽不定,运动幅度不够大,无法指哪打哪的行业问题,实现从 “视频生成” 到 “演技生成”,从 “动态流畅” 到 “情感表达” 的革命性跨越,标志着 AI 视频生成技术正式从追求 “形似” 进入追求 “神似” 的新纪元,将为内容创作、影视产业、广告营销等领域带来全新升级。 Vidu Q2 图生视频功能不仅能胜任复杂表情变化的文戏,常见的多人打斗场景的武戏,而且还能完美呈现大片中的炫酷特效。
9/25/2025 2:25:00 PM
机器之心

中国首个 Sora 级模型 Vidu 发布:可生成最长 16 秒、最高 1080P 视频

感谢生数科技今天出席中关村论坛未来人工智能先锋论坛,携手清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型 ——Vidu,被媒体和业内人士认为是国内首个 Sora 级别的视频大模型。 根据官方描述,Vidu 模型融合 Diffusion 与 Transformer,开创性创建了 U-ViT,支持一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。官方宣传资料中演示了“画室中的一艘船驶向镜头”、其海浪、船的效果非常逼真。官方表示 Vidu 不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生
4/27/2024 1:17:17 PM
故渊

国产文生视频大模型 Vidu 将迎更新:支持生成 32 秒内容、音视频合成

感谢据“钛媒体 AGI”周四报道,生数科技、清华大学联合发布的国内首个长时长、高一致性、高动态性的视频大模型 Vidu 将于近期完成三大更新,实现“重大技术迭代”。主要更新内容如下:支持一键生成 32s 视频支持音视频合成,“视频有声音了”(Text-2-Audio)支持 4D 生成,可以从单一视频生成时空一致的 4D 内容IT之家附部分视频预览: 据介绍,Vidu 是自 Sora 发布之后,全球率先取得重大突破的视频大模型,并且仍在加速迭代提升中。据IT之家此前报道,Vidu 模型融合 Diffusion
6/7/2024 2:25:35 PM
清源
  • 1