AI在线 AI在线

谷歌破解了 AI 最大难题(以及其他 19 个重大更新)

谷歌在 2025 年 I/O 大会上发布的内容,简直让人震惊。 这次更新涉及广泛,将极大提升你的工作效率,让你更快完成任务,成为更高效的人。 下面是谷歌 I/O 2025 的 20 个最疯狂 AI 更新盘点。

谷歌在 2025 年 I/O 大会上发布的内容,简直让人震惊。

这次更新涉及广泛,将极大提升你的工作效率,让你更快完成任务,成为更高效的人。

下面是谷歌 I/O 2025 的 20 个最疯狂 AI 更新盘点。

1. Veo 3

图片图片

Veo 3 是谷歌最新的顶尖视频生成模型,不仅能生成超真实的视频,符合物理规律,还能生成音频。

想象一下,它能自动生成背景音效、环境音,甚至对话声音。

图片图片

目前没有任何 OpenAI 或其他模型能一键同时生成视频和音频。

谷歌 I/O 自家的宣传片就是用 Veo 3 制作,效果惊艳。

图片图片

对我来说,这是本次大会最重要的 AI 更新。

2. Imagen 4

图片图片

Imagen 4 是谷歌最新的图像生成模型,回应 GPT-4 的图像能力。

图片图片

只需简单的文本提示,就能生成精准风格和高质量图片,效果令人印象深刻。

3. Flow

Flow 是让我最震撼的应用。

它不仅使用 Veo 3 生成视频,还能创作完整电影场景。

图片图片

你可以延长、剪辑或修改场景,操作无缝流畅。

这是一个利用 Veo 3 和 Imagen 4 来讲故事的神奇工具。

4. Lyria 2

图片

Lyria 2 是谷歌的音乐生成模型。

谷歌展示了音乐人 Shankar Mahadevan 用它创作音乐的过程,使用门槛极低,不需要 AI 专业知识。

这将科研成果带到普通用户手中,意义非凡。

5. Agentic Checkout

Agentic Checkout 帮你智能抢购衣服。

图片图片

它会在价格下降时通知你,一键加入购物车,自动选择尺寸,只需确认支付即可。

购物流程无缝顺畅,极大提升购物体验。

6. Google Try-on

上传全身照和衣服图片,Google 会精准叠加衣服效果,模拟试穿。

图片图片

它能识别体型、服装结构,利用 Gemini 多模态技术带来逼真体验。

7. Android XR 眼镜

谷歌推出新款 Android XR 眼镜,类似虚拟助手,全天候陪伴。

图片图片

眼镜能识别环境、记忆物品位置,还能投影导航路径。

合作品牌包括 Warby Parker,预计将成为数百万消费者的新 AI 产品。

图片图片

8. Google Beam

图片图片

Project Starline 的升级版 Google Beam 利用多摄像头捕捉 3D 立体影像,提供逼真的远程视频会议体验。

让远程会议像面对面一样自然。

9. Google Search AI 模式

Google Search 新增 AI 模式,基于 Gemini 2.5,具备深度调研能力,能浏览数百网站,快速汇总最相关信息。

图片图片

个性化上下文加持,避免虚假信息。

10. Gemini Agent 模式

Gemini 新增代理模式,帮你搜索本地房源,自动筛选符合条件的最佳选项,并在应用内呈现。

图片图片

类似 Operator,但基于 Gemini 平台。

11. Project Mariner

Project Mariner 是谷歌的 AI 代理应用,升级后可同时处理 10 个任务,支持“教学并重复”功能。

图片图片

教它你的工作流程,它就能代替你快速完成重复任务。

12. Project Astra 和 Gemini Live

通过手机摄像头展示实物,Gemini Live 结合 Project Astra 能给出深度且个性化的回答。

图片图片

支持屏幕共享,辅助学习各种软件。

13. Gemini 2.5

图片图片

Gemini 2.5 家族包含 2.5 Pro、2.5 Flash 和 2.5 Pro Deep Thinking,模型速度更快,推理能力更强,支持数学、编码和多模态任务。

14. SynthID

SynthID 是谷歌为 AI 生成内容加的隐形水印,用于追踪媒体来源。

图片图片

网络上已有超过 100 亿条带有 SynthID 的 AI 生成内容。

15. Gemini Text Diffusion

Gemini 利用扩散模型生成文本,比传统文本生成更快高效。

图片图片

这项技术原用于图像生成,现在也能写代码和解决数学题。

16. Stitch

Stitch 是一款 AI 应用设计和代码生成工具。

图片图片

输入简单需求,自动生成设计原型,经过确认后自动写代码,甚至可一键部署。

图片图片

实现了从文本到设计、到代码再到上线的完整流程。

17. Jules Coding Agent

图片图片

谷歌版 GitHub Copilot,支持导入项目代码,理解上下文,快速从文本生成可用应用。

任何人都能用文字描述快速搭建项目。

18. Gemini in Chrome

Chrome 插件版 Gemini,能随时帮你解答当前网页上的任何问题。

图片

支持日程安排等与 Google 应用无缝联动。

19. Google Meet 实时翻译

图片图片

支持不同语言实时翻译,让不同语言的人可以无障碍沟通。

20. Google AI 计费方案

Google AI 提供多种付费计划:

  • $20/月,基础工具包(Veo 2、Flow 等)
  • $250/月 Google AI Ultra,高端套餐,包含 Veo 3、Imagen 4、Flow 及全套代理功能

这是谷歌 AI 商业化的重要一步。

大局观

谷歌正在全力打造涵盖所有 AI 工具的生态系统,整合 Google 套件,为用户提供最优体验。

相关资讯

边缘AI框架全解析:谁是你的最佳选择?

随着人工智能技术的飞速发展,将AI模型部署到本地设备的需求日益增长。 本地AI框架应运而生,为开发者提供了一系列工具和库,使得在设备端运行复杂的AI模型成为可能。 本文将对当前流行的本地AI框架进行深入比较,帮助我们选择最适合的工具。
12/9/2024 8:54:49 AM
Zhen

低价Claude3.7极速使用,白票Deepseek满血R1

在当今数字化时代,人工智能技术正以前所未有的速度改变着我们的工作和生活方式。 无论你是开发者、创意工作者、还是企业管理者,拥有高效、经济的AI工具已成为提升效率的关键。 而今天,我要向大家隆重推荐的Token-AI平台,正是实现这一目标的完美解决方案。
3/11/2025 2:00:00 AM
tokengo

5090跑《黑神话》飙到200+帧,英伟达DLSS也用上Transformer了

现在,打个游戏都用上Transformer了? 老黄的DLSS进行了一波大升级,换上了基于Transformer的新大脑。 用上新模型之后,光线重建和超分辨率,效果都变得更细腻了。
1/20/2025 7:00:00 AM
量子位
  • 1