AI在线 AI在线

谷歌最强视频生成 AI 模型 Veo3 亮相:制作背景音、人物对话都不在话下

在今年的I/O开发者大会上,谷歌发布新一代视频生成模型Veo3,这也是其首个可生成视频背景音效的模型。它不仅能合成画面,还能为鸟鸣或街头交通等场景配上相应的音效。
感谢在今年的 I/O 开发者大会上,谷歌发布新一代视频生成模型 Veo3,这也是其首个可生成视频背景音效的模型。它不仅能合成画面,还能为鸟鸣或街头交通等场景配上相应的音效,甚至还可生成人物对话。

谷歌最强视频生成 AI 模型 Veo3 亮相:制作背景音、人物对话都不在话下

谷歌称,Veo 3 在物理模拟与口型同步方面也表现优异。目前,该模型仅面向美国地区的 Gemini Ultra 用户,以及 Vertex AI 的企业用户开放,也已集成进谷歌的 AI 影视制作工具 Flow 中。

谷歌最强视频生成 AI 模型 Veo3 亮相:制作背景音、人物对话都不在话下

用户仍可为 Veo 2 提供人物、风格、场景或物体的图像参考,并通过 Flow 使用镜头控制功能进行旋转、缩放,甚至将画面从竖屏调整为横屏,或在视频中添加、删除元素。

当前用户越来越难以辨别 AI 生成内容,谷歌为此推出了 SynthID Detector。用户可上传媒体文件以检测其是否包含 SynthID 水印,这是谷歌用于识别 AI 作品的标记工具。不过,目前并非所有图像生成模型都支持这一水印。

谷歌 I/O 开发者大会仍在进行,AI在线将保持关注。

2025 谷歌 I/O 开发者大会专题

相关资讯

谷歌 Meet 视频会议平台将上线 Gemini“AI 同传”,可还原声音、语气、情感

在今日的 I/O 大会上,谷歌宣布将语音翻译功能引入 Meet视频会议平台。该技术借助 Gemini 人工智能,可将用户语音实时翻译成对方所使用的语言。
5/21/2025 1:22:12 AM
清源

谷歌发布 Gemma 3n 端侧多模态模型,2GB 内存也能玩转 AI

今天召开的 2025 年 I/O 开发者大会上,谷歌推出了 Gemma 3n 端侧多模态 AI 模型,可以在手机、平板和笔记本电脑上本地运行,处理音频、文本、图片和视频多种数据类型。
5/21/2025 2:30:27 PM
故渊

遏制深度伪造:谷歌推出 SynthID Detector“AI 打假工具”

在 2025 年 I/O 开发者大会上,谷歌推出解决深度伪造(deepfake)和虚假信息问题,推出 SynthID Detector,是一款通过数字水印识别 AI 生成媒体的新工具。
5/22/2025 10:27:31 AM
故渊
  • 1