AI在线 AI在线

谷歌为 Veo 添加全新视频“精确编辑”功能:轻松添加或删除元素

谷歌 DeepMind 今日宣布为其领先的 AI 视频生成模型 Veo 引入革命性的“精确编辑”功能。 该功能允许用户通过简单文本提示轻松向现有视频中添加或删除元素,如道具、角色或背景物体,同时智能重建场景以确保物理真实性和视觉连贯性,完美保留原始视频的完整性。 据 AIbase 报道,此次更新标志着 AI 视频编辑从粗放式生成向精细化后处理转型,将极大提升创作者在 Flow 平台上的生产效率。

谷歌 DeepMind 今日宣布为其领先的 AI 视频生成模型 Veo 引入革命性的“精确编辑”功能。该功能允许用户通过简单文本提示轻松向现有视频中添加或删除元素,如道具、角色或背景物体,同时智能重建场景以确保物理真实性和视觉连贯性,完美保留原始视频的完整性。

据 AIbase 报道,此次更新标志着 AI 视频编辑从粗放式生成向精细化后处理转型,将极大提升创作者在 Flow 平台上的生产效率。 Veo 的精确编辑功能是 Veo3.1升级的一部分,专为谷歌的 AI 电影制作工具 Flow 设计。它利用先进的生成式 AI 算法,考虑光影、比例、物体交互和运动轨迹,实现无缝修改。

例如,用户可以指示“向场景中添加一辆黄色校车”或“移除路边的行人”,模型将自动填充背景、调整阴影并维持相机运动的一致性,避免传统编辑软件中常见的“跳帧”或不自然痕迹。在演示视频中,该功能展示了从静态图像到动态多镜头叙事的完整流程,用户仅需几秒钟即可迭代内容,而无需重新拍摄或手动蒙版。

 据 AIbase 分析,Veo3.1的核心创新包括增强的音频同步、多提示场景生成和原生1080p 输出,支持视频长度扩展至1分钟。这使得精确编辑不仅适用于短片创作者,还能服务于广告、营销和企业培训场景。例如,在 Flow 中,用户可上传“成分”(如预定义角色或风格参考),然后通过精确编辑扩展镜头,实现从单帧到完整故事板的自动化。相比前代 Veo3,该版本在角色一致性和叙事控制上提升了30% 以上,基准测试显示编辑准确率达95%,显著优于竞争对手如 OpenAI 的 Sora2。 “精确编辑让 AI 视频创作真正民主化,用户无需专业技能即可实现好莱坞级别的修改,”

DeepMind 在官方博客中表示,该功能已集成至 Flow 的实验性工具中,支持 Google AI Pro 和 Ultra 订阅用户优先访问。开发者可通过 Vertex AI 平台预览企业级应用,包括自定义语音和物体移除优化。此前 Veo 已在 Imagen3和 Chirp3模型中展现出类似 inpainting 能力,推动视频 AI 从实验阶段向生产就绪转型。 随着内容创作者对高效工具的需求激增,Veo 的精确编辑有望重塑数字叙事生态,从独立电影到社交媒体短视频均受益匪浅。

相关资讯

谷歌 AI 视频生成模型 Veo 2 使用费用公布:每分钟 30 美元

谷歌近期在其定价页面上低调公布了新一代 AI 视频生成模型 Veo 2 的使用费用。该模型于去年 12 月首次亮相,旨在通过人工智能技术快速生成高质量的视频内容。根据官方信息,使用 Veo 2 的成本为每秒 50 美分(IT之家备注:当前约 3.6 元人民币),换算下来,每分钟的费用为 30 美元(当前约 218 元人民币),每小时则高达 1800 美元(当前约 13060 元人民币)。
2/24/2025 7:59:41 AM
远洋

谷歌 Veo 2 升级可生成更具电影感视频,文本、音频 AI 同步升级

谷歌为视频AI模型Veo 2推出修复、外扩等新功能,可自动移除干扰元素或扩展画面,支持电影技巧预设,提升视频编辑效率。同步更新的还有Imagen 3图像模型及音频AI工具。#谷歌AI# #视频生成技术#
4/10/2025 2:54:59 PM
远洋

谷歌计划融合 Gemini 与 Veo 模型,打造全能 AI 助手

谷歌DeepMind CEO透露,计划将Gemini AI与Veo视频生成模型融合,提升AI对物理世界的理解能力。Gemini已支持多模态,可生成图像、文本和音频,行业正朝“全能”模型发展。#AI技术##谷歌Gemini#
4/13/2025 8:53:57 AM
远洋
  • 1