谷歌Veo 3强势发布：视频生成迈入音画同步新时代

作者：AI在线 2025-05-22 10:00

谷歌最近推出了其最新的视频生成模型 Veo3，标志着 AI 视频技术的一次重大飞跃。这款新模型实现了音画同步生成功能，能够根据用户的提示词，自动生成包含对白、唇动对齐和环境音效的高质量视频。这一突破使得 AI 视频制作跨越了多模态的边界，让视频不仅会动，还会说话。

Veo3的核心技术是名为 V2A（Video-to-Audio）的算法，该技术能够将视频的视觉信息转化为语义信号，并与文本提示结合生成音轨。结合谷歌在 YouTube 等平台上积累的丰富数据资源，Veo3在音画合成能力上展现出令人惊叹的表现。目前，该工具虽然仅面向美国的高阶订阅用户开放，但它的推出无疑给视频创作领域带来了新的可能性。

滑雪、极限运动

图源备注：图片由AI生成，图片授权服务商Midjourney

Veo3的强大功能体现在多个方面。首先，它能够自动生成唇动对齐的对话和拟真音效。例如，用户只需输入一句简单的提示，Veo3就能生成一段完整的场景视频，包含人物对话、环境音效，甚至是观众的笑声，这种真实感让人耳目一新。其次，Veo3具备对复杂提示的理解能力，可以生成逻辑连贯、时间有序的视频片段，这在以往的视频生成模型中是非常困难的。最后，该模型在处理物理世界声音方面表现出色，能够模拟脚步声、烹饪声等，使得视频更具生动性和沉浸感。

尽管 Veo3的短视频长度限制为8秒，并且目前仅面向249.99美元的高阶订阅用户，但其强大的音画同步能力已引发广泛关注。未来，随着技术的进一步发展，Veo3无疑将推动视频生成技术迈向新的高度。

今年最被低估的AI模型之一，重现李小龙功夫音

AI好好用报道编辑：Sia音频视频的同步生成，是时候开卷了~承认吧，虽然谷歌 Veo2 在视频生成上完虐了 Sora，但生成的还是个默片。没声音的 AI 视频，说白了就是个半成品。看看这组数字：谷歌开放的大规模音频数据集 AudioSet 显示，82% 以上的视频都有人声或音乐；去年抖音上传的 100 多亿条视频里，差不多八成都配了背景音乐。

12/24/2024 6:32:00 PM AI好好用

从文本到电影！谷歌Veo3 震撼发布：4K画质、音视频一体生成

在2025年5月20日举办的Google I/O开发者大会上，谷歌正式发布了其最新一代视频生成模型Veo3，标志着人工智能视频生成技术迈向新高峰。 Veo3不仅在画质和真实感上显著提升，还首次集成了原生音频生成功能，为视频创作者提供了前所未有的创作可能性。以下是AIbase整理的关于Veo3的核心亮点与技术突破。

5/21/2025 9:01:05 AM AI在线

ElevenLabs推可定制音效控制面板工具SB-1 Infinite Soundboard

人工智能音频领域的领军企业ElevenLabs再次掀起行业波澜，于今日正式推出一款基于 AI 的可定制音效控制面板工具——SB-1Infinite Soundboard。用户可以通过点击按钮播放、组合、循环各种音效，或者可以通过文本提示生成全新的 AI 音效。技术亮点:文本驱动的无限音效生成SB-1Infinite Soundboard的核心在于其基于Text-to-SFX模型的音效生成能力。

5/16/2025 11:00:55 AM AI在线

谷歌Veo 3强势发布：视频生成迈入音画同步新时代

相关资讯

今年最被低估的AI模型之一，重现李小龙功夫音

从文本到电影！谷歌Veo3 震撼发布：4K画质、音视频一体生成

​ElevenLabs推可定制音效控制面板工具SB-1 Infinite Soundboard

ElevenLabs推可定制音效控制面板工具SB-1 Infinite Soundboard