AI在线 AI在线

谷歌Veo 3强势发布:视频生成迈入音画同步新时代

谷歌最近推出了其最新的视频生成模型 Veo3,标志着 AI 视频技术的一次重大飞跃。 这款新模型实现了音画同步生成功能,能够根据用户的提示词,自动生成包含对白、唇动对齐和环境音效的高质量视频。 这一突破使得 AI 视频制作跨越了多模态的边界,让视频不仅会动,还会说话。

谷歌最近推出了其最新的视频生成模型 Veo3,标志着 AI 视频技术的一次重大飞跃。这款新模型实现了音画同步生成功能,能够根据用户的提示词,自动生成包含对白、唇动对齐和环境音效的高质量视频。这一突破使得 AI 视频制作跨越了多模态的边界,让视频不仅会动,还会说话。

Veo3的核心技术是名为 V2A(Video-to-Audio)的算法,该技术能够将视频的视觉信息转化为语义信号,并与文本提示结合生成音轨。结合谷歌在 YouTube 等平台上积累的丰富数据资源,Veo3在音画合成能力上展现出令人惊叹的表现。目前,该工具虽然仅面向美国的高阶订阅用户开放,但它的推出无疑给视频创作领域带来了新的可能性。

滑雪、极限运动

图源备注:图片由AI生成,图片授权服务商Midjourney

Veo3的强大功能体现在多个方面。首先,它能够自动生成唇动对齐的对话和拟真音效。例如,用户只需输入一句简单的提示,Veo3就能生成一段完整的场景视频,包含人物对话、环境音效,甚至是观众的笑声,这种真实感让人耳目一新。其次,Veo3具备对复杂提示的理解能力,可以生成逻辑连贯、时间有序的视频片段,这在以往的视频生成模型中是非常困难的。最后,该模型在处理物理世界声音方面表现出色,能够模拟脚步声、烹饪声等,使得视频更具生动性和沉浸感。

尽管 Veo3的短视频长度限制为8秒,并且目前仅面向249.99美元的高阶订阅用户,但其强大的音画同步能力已引发广泛关注。未来,随着技术的进一步发展,Veo3无疑将推动视频生成技术迈向新的高度。

相关资讯

从文本到电影!谷歌Veo3 震撼发布:4K画质、音视频一体生成

在2025年5月20日举办的Google I/O开发者大会上,谷歌正式发布了其最新一代视频生成模型Veo3,标志着人工智能视频生成技术迈向新高峰。 Veo3不仅在画质和真实感上显著提升,还首次集成了原生音频生成功能,为视频创作者提供了前所未有的创作可能性。 以下是AIbase整理的关于Veo3的核心亮点与技术突破。
5/21/2025 9:01:05 AM
AI在线

今年最被低估的AI模型之一,重现李小龙功夫音

AI好好用报道编辑:Sia音频视频的同步生成,是时候开卷了~承认吧,虽然谷歌 Veo2 在视频生成上完虐了 Sora,但生成的还是个默片。 没声音的 AI 视频,说白了就是个半成品。 看看这组数字:谷歌开放的大规模音频数据集 AudioSet 显示,82% 以上的视频都有人声或音乐;去年抖音上传的 100 多亿条视频里,差不多八成都配了背景音乐。
12/24/2024 6:32:00 PM
AI好好用

​ElevenLabs推可定制音效控制面板工具SB-1 Infinite Soundboard

人工智能音频领域的领军企业ElevenLabs再次掀起行业波澜,于今日正式推出一款基于 AI 的可定制音效控制面板工具——SB-1Infinite Soundboard。  用户可以通过点击按钮播放、组合、循环各种音效,或者可以通过文本提示生成全新的 AI 音效。 技术亮点:文本驱动的无限音效生成SB-1Infinite Soundboard的核心在于其基于Text-to-SFX模型的音效生成能力。
5/16/2025 11:00:55 AM
AI在线
  • 1