Gemini 2.5 Pro再更新！编程能力屠榜！一句话、一张草图变应用

作者： 2025-05-07 10:09

出品 | 51CTO技术栈（微信号：blog51cto）AI 编码模型的新王者登基了！今天，Google 旗下的 DeepMind AI 研究部门正式发布了 Gemini 2.5 Pro “I/O” 版，这是今年 3 月推出的 Gemini 2.5 Pro 多模态大语言模型（LLM）的更新版本。 DeepMind CEO Demis Hassabis 在 X 上表示：“这是我们迄今为止打造的最佳编码模型！

出品 | 51CTO技术栈（微信号：blog51cto）

AI 编码模型的新王者登基了！今天，Google 旗下的 DeepMind AI 研究部门正式发布了 Gemini 2.5 Pro “I/O” 版，这是今年 3 月推出的 Gemini 2.5 Pro 多模态大语言模型（LLM）的更新版本。

Gemini 2.5 Pro再更新！编程能力屠榜！一句话、一张草图变应用

DeepMind CEO Demis Hassabis 在 X 上表示：“这是我们迄今为止打造的最佳编码模型！”

Gemini 2.5 Pro再更新！编程能力屠榜！一句话、一张草图变应用

在 WebDev Arena 榜单（一个基于人类偏好、评估模型生成美观且实用 Web 应用能力的第三方指标）上，Gemini 2.5 Pro Preview（05-06）现已超越 Anthropic 的 Claude 3.7 Sonnet，登顶第一。

Gemini 2.5 Pro再更新！编程能力屠榜！一句话、一张草图变应用

此次更新的最大亮点，在于模型能仅通过一句提示生成完整、可交互的 Web 应用或模拟项目，根据草图完成应用的编程等等。这正符合 DeepMind 一贯强调的“简化原型开发流程”的愿景。

Gemini 2.5 Pro再更新！编程能力屠榜！一句话、一张草图变应用

新版本模型进一步助力应用中的功能开发，能够自动匹配组件的视觉风格，还能实现如将 YouTube 视频转换为功能齐全的学习应用、或用极少甚至无需 CSS 手动编辑就创建出响应式视频播放器或动态语音 UI 等工作流。

Gemini 2.5 Pro再更新！编程能力屠榜！一句话、一张草图变应用

这款新版本标识为 “gemini-2.5-pro-preview-05-06”，取代了之前的 03-25 版本，现在已面向独立开发者开放（通过 Google AI Studio），也面向企业客户上线（通过 Vertex AI 云平台），同时普通用户可在 Gemini App 中体验。Google 在博客中指出，新模型还为 Gemini 移动端的 Canvas 画布功能及其他组件提供支持。

该模型为闭源专有模式，企业需要付费使用，仅可通过 Google 的 Web 服务访问。不过它并未改变价格或速率限制，当前 Gemini 2.5 Pro 用户将自动切换至新版本。价格为每百万输入/输出 token 分别为 $1.25 / $10（上下文长度为 200,000 token），而 Claude 3.7 Sonnet 的对应价格为 $3 / $15。

相关标签：

大语言模型多模态 Gemini 2.5

相关资讯

多模态大语言模型(LLM) 和视频语言预训练的关键进展、应用、数据集和方法

多模态大语言模型(LLM) 和视频语言预训练的关键进展、应用、数据集和方法

随着视频应用的发展，大量视频被上传到网上。因此，如何利用视频及其对应的弱字幕进行表征学习成为近期的热门话题。本文将回顾大规模视频语言预训练任务的最新进展、后续应用、基础数据集和技术。

7/24/2025 2:00:00 AM 晓晓

谷歌大招网友玩疯了！Gemini原生图像输出抢先推出，OpenAI一年领先优势归零

谷歌大招网友玩疯了！Gemini原生图像输出抢先推出，OpenAI一年领先优势归零

谷歌推出Gemini原生图像生成，测试版瞬间引爆网络。如果你迟到了，但没有好的借口，甚至还没有出家门——只需要一张自拍，然后让AI把你P到地铁故障现场。图片也可以凭空生成一个人物形象，把它放到原神游戏画面中（不用上传游戏截图），让角色往前走两步，再把视角往左移，走近一个建筑，开始爬墙。

3/14/2025 12:14:38 PM

Gemini负责人爆料！多模态统一token表示，视觉至关重要

Gemini负责人爆料！多模态统一token表示，视觉至关重要

一水闻乐发自凹非寺. 量子位 | 公众号 QbitAI一次性揭秘Gemini多模态技术！就在刚刚，Gemini模型行为产品负责人Ani Baddepudi在谷歌自家的开发者频道开启了爆料模式。

7/3/2025 3:06:44 PM 闻乐