AI在线 AI在线

谷歌DeepMind计划整合Gemini与Veo,打造智能全能助手

在人工智能领域不断创新的谷歌,近日宣布了一项激动人心的计划。 谷歌 DeepMind 的首席执行官 Demis Hassabis 在播客节目 Possible 中透露,公司将把其 Gemini AI 模型与 Veo 视频生成模型进行整合。 这一举措旨在提升 Gemini 对物理世界的理解能力,助力开发出一个真正能够在现实生活中为用户提供帮助的通用数字助手。

在人工智能领域不断创新的谷歌,近日宣布了一项激动人心的计划。谷歌 DeepMind 的首席执行官 Demis Hassabis 在播客节目 Possible 中透露,公司将把其 Gemini AI 模型与 Veo 视频生成模型进行整合。这一举措旨在提升 Gemini 对物理世界的理解能力,助力开发出一个真正能够在现实生活中为用户提供帮助的通用数字助手。

Hassabis 指出,从一开始,Gemini 模型就被设计为一个多模态系统,能够处理多种类型的数据和信息。他表示:“我们的愿景是构建一个能够整合各种媒体形式的助手,这样它才能更好地理解和与世界互动。” 目前,Gemini 模型已经能够生成图像、文本和音频,展示出强大的多模态能力。

image.png

值得注意的是,整个 AI 行业正在向 “全能” 模型发展,许多公司都在探索类似的方向。例如,OpenAI 的 ChatGPT 不仅可以处理文本对话,还能生成艺术风格的图像。此外,亚马逊也计划推出一款全新的 “任意到任意” 的模型,旨在实现更高水平的多模态功能。

Hassabis 透露,Veo 模型的训练数据主要来自谷歌旗下的 YouTube 平台。通过分析大量 YouTube 视频,Veo 能够有效学习世界的物理规律。他指出:“Veo2通过观看大量的视频,能够更好地理解现实世界的运作方式。” 这表明,Veo 在训练过程中所使用的数据不仅丰富,而且具有实际应用价值。

谷歌在去年已扩大了其服务条款,以便获取更多的 YouTube 内容用于 AI 模型训练,确保模型的多样性和准确性。这样的数据获取策略无疑将为 Gemini 和 Veo 的结合提供坚实的基础,使得即将推出的智能助手能够更全面、更深刻地理解和响应用户的需求。

随着技术的不断进步,谷歌的这一计划预示着 AI 助手将不再局限于单一任务,而是能够在多个领域提供实用的支持,为用户的生活带来更多的便利。

相关资讯

谷歌 DeepMind 推出新 AI 模型,机器人未经训练也能执行现实任务

北京时间今晚,谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务。
3/12/2025 11:22:56 PM
清源

谷歌推机器人控制模型Gemini Robotics,让机器人像人类一样思考行动

谷歌DeepMind推出了他们的秘密武器——Gemini Robotics! 这可不是你家扫地机器人那点小打小闹,而是要将AI的智慧真正注入钢铁之躯,让机器人也能像咱们一样(甚至更聪明地)在物理世界里大显身手。 无所不能的“多面手”Gemini Robotics的核心在于其基于先进的Gemini2.0模型。
3/13/2025 10:54:00 AM
AI在线

Google 发布 TxGemma 开源模型,助力加速治疗性药物研发

近日,谷歌宣布推出全新开源模型 TxGemma,专为提升治疗性药物的研发效率而设计。 这一模型由谷歌 DeepMind 团队基于其先进的 Gemma 模型家族微调开发,融合了强大的语言理解、科学预测以及多轮对话功能,旨在为药物研发领域带来革命性的突破。 TxGemma 的发布被视为人工智能技术在生物医药领域的重要进展,有望大幅缩短药物从实验室到临床的周期,同时降低高昂的研发成本和失败率。
3/31/2025 11:05:00 AM
AI在线
  • 1