AI在线 AI在线

早报速读!2025年5月最新AI视频产品评测&优秀案例

备注:这篇文章写于 Veo3 发布前夕. 自 24 年 H2 开始,AI 视频行业以周为单位高速发展,GenLumio 是我从 24 年开始 0-1 规划 - 设计 - 开发的 AI 视频项目,旨在为大家带来每周最新鲜的 AI 视频优秀作品、产品动向。 我计划通过这个系列的文章选取新鲜产品动向、优质作品案例为大家介绍。

早报速读!2025年5月最新AI视频产品评测&优秀案例

备注:这篇文章写于 Veo3 发布前夕

自 24 年 H2 开始,AI 视频行业以周为单位高速发展,GenLumio 是我从 24 年开始 0-1 规划 - 设计 - 开发的 AI 视频项目,旨在为大家带来每周最新鲜的 AI 视频优秀作品、产品动向。

我计划通过这个系列的文章选取新鲜产品动向、优质作品案例为大家介绍。

上期资讯合集:

AI视频资讯早读!7个产品更新+8个案例精选

自 24 年 H2 开始,AI 视频行业以周为单位高速发展,GenLumio 是我从 24 年开始 0-1 规划-设计-开发的 AI 视频项目,旨在为大家带来每周最新鲜的 AI 视频优秀作品、产品动向。

阅读文章 >

一、AI 视频模型 & 产品主要更新

Runway

Runway 发布了 Gen-4 文本转图像及图片 References 功能,测试案例达到了令人吃惊的地步 —— 可以通过添加结构参考图,将主体物可以置于参考场景中,同时可通过Prompt控制新的摄像机角度、构图、角色造型等细节。混合后的新图片中,有非常适宜的灯光、阴影和构图效果,甚至能识别简单的构图标注进行图像生成。同时也支持对图片风格进行参考。

该功能可以用于主体物多角度一致性、绿幕图生成、甚至 3D 模型在不同场景的渲染,以下是一些案例:

早报速读!2025年5月最新AI视频产品评测&优秀案例

早报速读!2025年5月最新AI视频产品评测&优秀案例

早报速读!2025年5月最新AI视频产品评测&优秀案例

当视频在手机上无法加载,可前往PC查看。

该能力可以快速实现 3D 白模在不同场景的渲染

这里值得一提的是 Runway 参考图片引用的交互方式,就像@某个人那样,你可以通过@来引用需要参考的图像,来替代在历史图片库中查找。

早报速读!2025年5月最新AI视频产品评测&优秀案例

Veo2 可以免费体验了

Veo2 的体验入口终于被我找到了,Google 的产品入口比较分散,交互体验也很一般,但这不影响我对 Veo2 模型能力的赞美之情。Veo2 支持生成 8s 视频,并且可以上传图片体验 I2V,测了几条感觉 T2V 的效果是真不错,I2V 的部分案例非常惊艳,提示词遵循能力做的很好,绝对是当下第一梯队的模型能力。例如这个篮球进入篮筐的镜头,我测试过世面上大部分模型只有 Veo2 干净利落的成功了。

当视频在手机上无法加载,可前往PC查看。

现在每日可以免费生成几个无水印视频,日常需求已足够:https://aistudio.google.com/generate-video

Pixverse

刚刚更新了 4.5 模型,更新了 20+ 摄像机控制功能、多元素参考和融合,并且模型价格相比 4.0 降低了一些,但比起其他产品还是偏贵的,效果也不在第一梯队,就不过多介绍了。

HeyGen

HeyGen 近期进行了产品大幅更新。真实人物、宠物、插画都可以生成对口型视频,除了对口型的准确度提高,另外还支持了多角度对口型:侧面、仰视视角都可以生成。嘴巴以外,人物的面部肌肉有自然的运动,看了一些案例,通常人物的手部、整体画面也有轻微运动,但如果这样的运动可以更多,再配合一些镜头移动效果,视频的真实感会得到极大提升。

当视频在手机上无法加载,可前往PC查看。

使用 HeyGen 制作音乐 MV

其中语音镜像功能很有趣,AI 可以模仿你输入的真实音调、语调和节奏,并且匹配对应口型,这个功能极大提高了视频制作的可控性。

当视频在手机上无法加载,可前往PC查看。

HeyGen 语音镜像

另外推荐一则 HeyGen 制作的创意短片。

当视频在手机上无法加载,可前往PC查看。

visiblemakers 使用 HeyGen 制作的短片

新产品

① Pippit 字节电商营销新产品

继去年写过 HeyGen、Opus Clip 之后,在 AI 视频进展中还没有提过电商营销新产品,近期 Capcut 背后的新产品 Pippit 在 Product Hunt 登顶,提供的能力非常丰富。

早报速读!2025年5月最新AI视频产品评测&优秀案例

我输入了 GenLumio 的网页链接,消耗 120 积分让 Pippit 帮我的网站制作视频,Pippit 一次性生成了 10 条视频,看上去每条视频的数字人语气都真的像那么回事的。只是在爬取了网页信息后,AI 撰写的文本对 GenLumio 的功能进行了夸大,产品介绍文本基本没法用,需要后期人工调整。

当视频在手机上无法加载,可前往PC查看。

同时,该领域还有 Creatify、Captions 值得关注。

② Medeo

一款 AI 视频剪辑的 Agent 产品,支持输入 URL、文章、文件内容进行视频生成。

早报速读!2025年5月最新AI视频产品评测&优秀案例

我先是输入了此前 AI Coding 的文章和 GenLumio 网站进行测试。和 Pippit 不同,Medeo 并没有使用文章或者网页中的相关资源,而是通过对内容进行一定总结后生成了一段总结性文本,并且根据内容生成了图片,再进行图生视频。生成的效果有点像科普风(也可能和我的内容有关),如果想要建立有特色的个人账号,可能还是要花一些功夫,但是对一些新闻科普、小说故事剧情讲解视频来说,这种快速低成本制作出来的视频已经够用了。

下面的视频分别是让 Medeo 生成间谍过家家动漫介绍短片;对 AI Coding 文章进行总结,在短视频平台介绍我的 AI Coding 经验:

当视频在手机上无法加载,可前往PC查看。

交互上 Medeo 提交 Prompt 后会直接消耗大额积分进行视频生成,生成视频中的文本也和输入 Prompt 的语言匹配,这点前置感知也非常不强烈。Medeo 缺乏了 Gemini、Lovart 等产品分布完成或主动确认任务的可控感。如果在执行几十秒视频生成的复杂任务前,事先进行任务理解、偏好询问,并对生图、文案进行分步确认,会让结果更具备可控性。

早报速读!2025年5月最新AI视频产品评测&优秀案例

Gemini 和 Lovart 的确认过程

感兴趣的朋友可以试用,每个账号可免费生成一次: https://ai.medeo.app

③ Ponder

一个即将发布的 AI 视频编辑器,可以通过 Prompt 命令对原始拍摄素材进行 AI 剪辑

这里加入 waitlist: https://ponder.ai/

当视频在手机上无法加载,可前往PC查看。

二、最新优秀案例

动漫短片

传统动画师使用 Runway 做了非常优秀的动画剧集《Mars and Siv. 》,现推出了第一集。整体风格创作模仿了小时候的动画片,分镜、角色设计和场景建模均由传统流程中的人工完成,通过 Runway 对渲染图进行连贯动画生成,然后刻意抽取中间帧,做成了定格效果。

文章中讲述了详细创作过程: https://runwayml.com/customers/the-making-of-mars-and-siv

视频中很多画面采取了分角色生成+绿幕合成的制作:

当视频在手机上无法加载,可前往PC查看。

再次被 yachimat 的作品惊艳到,不论画面美感、配音、BGM、动画效果都是日漫风格创作者中的绝佳了。

当视频在手机上无法加载,可前往PC查看。

叙事短片

来自 Runway CEO Cristóbal Valenzuela 发表的作品,讲述了一只猫在城市中的生活,短片中动物肢体运动协调真实,镜头跟随猫咪进入不同场景,镜头切换非常自然。

当视频在手机上无法加载,可前往PC查看。

广告片两则

来自汗青团队的新作(创意真的没有瓶颈),这是一条 Lovart 的广告片,讲述 AI 是如何做梦露的 IP 商业化设计的,视频故事从一次安迪沃霍尔的设计师面试开始说起。

当视频在手机上无法加载,可前往PC查看。

Snoop Dogg 的作品。由 Dave Meyers 执导。携手 30 多位艺术家,将传统艺术(3D、绘画等)与 AI 结合,画面有一些拼贴艺术效果。

当视频在手机上无法加载,可前往PC查看。

4 个视频制作经验分享

来自 Freepik 官方的视频,这套面部表情的提示效果非常好

当视频在手机上无法加载,可前往PC查看。

来自 Ray (movie arc)分享的案例:Gen-4 提示词技巧:“视图突然被四等分,同一镜头的不同未来发生在四个四分之一中”(二等分和“细分为 X”也有效)

当视频在手机上无法加载,可前往PC查看。

来自 madpencil_分享的案例:上传一张黑色空白图片,然后在上面提示任何内容,这个技巧几乎适用于所有平台,尤其是在像 Gen 4 这样的模型上:低角度拍摄,摄像机跟踪一滴清澈的水摆动并弹跳下来/漂浮/(地点设置),水滴溅到摄像机镜头上,形成了文字“XYZ”。

当视频在手机上无法加载,可前往PC查看。

来自 Cristobal Valenzuela 分享的案例:如果你希望在 Gen-4 中实现有趣的摄像机运动,一个很好的建议是使用如下提示结构:“允许摄像机在整个场景中完全自由地移动,采用动态技术,例如俯冲空中运动、戏剧性的俯冲过渡、快速鞭打摇摄和平滑跟踪”。

当视频在手机上无法加载,可前往PC查看。

三、近期 AI 视频产品调研结论

记录下近期 AI 视频产品的观察结论:

  1. Runway、Luma 等产品这几个月一直在发力生图模型能力,AI Wrapper 忙着把所有模型能力集成在一起。在 AI 生图、视频方向上,也许存在定义下一代交互方式的机会,没有创业者会不为此心动
  2. 主体物参考(画面内容一致性、风格迁移)、首尾帧是视频创作的刚需,前者除了 Veo 和 Sora,其他主流产品几乎全部支持,后者 Hailuo AI 还没有补齐
  3. 调研了一圈 AI 视频模型每秒生成成本,Veo($0.3/s)以微弱差异高于 Runway Gen4($0.29/s)成为最贵模型,但 Veo 的效果真的让人没话说,Google 在 AI 模型领域的长期发展还是可期待的。

综合价格和生成效果来看,Vidu Q1($0.06/s)依然是动漫领域性价比较高的选择,和同价格档位其他产品相比 Q1 可以直出 1080P 画质,近期还推出了升级 2K、4K 能力,生成速度很快,继续推荐。

Kling 1.6 720P($0.04/s)确实是最便宜的模型,偏好真实系方向的朋友可选择。

相关资讯

Runway Gen-3的视频转绘功能太牛了!大片制作0门槛!

大家好我是花生~ Runway 在推出 Gen-3 Alpha 视频生成模型后,还一直有一些小的更新,比如推出了新的 Turbo 模型,生成速度比原来快了 7 倍;支持尾帧控制;支持将视频延长至 40s 等,都是非常符合用户需求的优化提升。 而它前几天推出的 V2V (Video to Video) 功能,更是将 AI 视频在风格转绘上的水平提升到了一个新的高度,再次秀了一波「AI 视频生成王者」的实力。该功能一经推出就受到众多专业 AI 视频创作者的称赞,并迅速衍生出多种玩法,很有潜力成为一个新的流量风口,喜欢
9/20/2024 7:27:24 AM
夏花生

8秒出大片!10个案例实测谷歌Veo 3视频生成功能

前几天的 2025 年 Google I/O 开发者大会上,谷歌发布了一系列先进的图像和视频生成工具,好玩的太多了,我还没来得及一一体验,今天先尝试一下最近超级火的 Veo 3 视频生成。 后续再尝试下 Imagen 4 和 Flow 平台和大家分享。 先简单介绍一下。
5/27/2025 7:31:45 AM
阿真Irene

实测 Google Veo 3:AI 视频终于能开口“说话”了 (附白嫖攻略+提示词技巧)

大家好,我是言川。 Google 在上周还整了个大活:在 I/O 大会上正式发布了全新的视频生成模型——Veo 3。 说实话,当我第一次看到它的演示视频时,脑子里冒出来的第一个词就是:离谱。
5/29/2025 7:57:37 AM
言川Artie
  • 1