AI在线 AI在线

Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用

出品 | 51CTO技术栈(微信号:blog51cto)AI 编码模型的新王者登基了! 今天,Google 旗下的 DeepMind AI 研究部门正式发布了 Gemini 2.5 Pro “I/O” 版,这是今年 3 月推出的 Gemini 2.5 Pro 多模态大语言模型(LLM)的更新版本。 DeepMind CEO Demis Hassabis 在 X 上表示:“这是我们迄今为止打造的最佳编码模型!

出品 | 51CTO技术栈(微信号:blog51cto)

AI 编码模型的新王者登基了!今天,Google 旗下的 DeepMind AI 研究部门正式发布了 Gemini 2.5 Pro “I/O” 版,这是今年 3 月推出的 Gemini 2.5 Pro 多模态大语言模型(LLM)的更新版本。

Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用

DeepMind CEO Demis Hassabis 在 X 上表示:“这是我们迄今为止打造的最佳编码模型!”

Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用

在 WebDev Arena 榜单(一个基于人类偏好、评估模型生成美观且实用 Web 应用能力的第三方指标)上,Gemini 2.5 Pro Preview(05-06)现已超越 Anthropic 的 Claude 3.7 Sonnet,登顶第一。

Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用

此次更新的最大亮点,在于模型能仅通过一句提示生成完整、可交互的 Web 应用或模拟项目,根据草图完成应用的编程等等。这正符合 DeepMind 一贯强调的“简化原型开发流程”的愿景。

Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用

新版本模型进一步助力应用中的功能开发,能够自动匹配组件的视觉风格,还能实现如将 YouTube 视频转换为功能齐全的学习应用、或用极少甚至无需 CSS 手动编辑就创建出响应式视频播放器或动态语音 UI 等工作流。

Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用

这款新版本标识为 “gemini-2.5-pro-preview-05-06”,取代了之前的 03-25 版本,现在已面向独立开发者开放(通过 Google AI Studio),也面向企业客户上线(通过 Vertex AI 云平台),同时普通用户可在 Gemini App 中体验。Google 在博客中指出,新模型还为 Gemini 移动端的 Canvas 画布功能及其他组件提供支持。

该模型为闭源专有模式,企业需要付费使用,仅可通过 Google 的 Web 服务访问。不过它并未改变价格或速率限制,当前 Gemini 2.5 Pro 用户将自动切换至新版本。价格为每百万输入/输出 token 分别为 $1.25 / $10(上下文长度为 200,000 token),而 Claude 3.7 Sonnet 的对应价格为 $3 / $15。

相关资讯

多模态大语言模型(LLM) 和视频语言预训练的关键进展、应用、数据集和方法

随着视频应用的发展,大量视频被上传到网上。 因此,如何利用视频及其对应的弱字幕进行表征学习成为近期的热门话题。 本文将回顾大规模视频语言预训练任务的最新进展、后续应用、基础数据集和技术。
7/24/2025 2:00:00 AM
晓晓

谷歌大招网友玩疯了!Gemini原生图像输出抢先推出,OpenAI一年领先优势归零

谷歌推出Gemini原生图像生成,测试版瞬间引爆网络。 如果你迟到了,但没有好的借口,甚至还没有出家门——只需要一张自拍,然后让AI把你P到地铁故障现场。 图片也可以凭空生成一个人物形象,把它放到原神游戏画面中(不用上传游戏截图),让角色往前走两步,再把视角往左移,走近一个建筑,开始爬墙。
3/14/2025 12:14:38 PM

Gemini负责人爆料!多模态统一token表示,视觉至关重要

一水 闻乐 发自 凹非寺. 量子位 | 公众号 QbitAI一次性揭秘Gemini多模态技术! 就在刚刚,Gemini模型行为产品负责人Ani Baddepudi在谷歌自家的开发者频道开启了爆料模式。
7/3/2025 3:06:44 PM
闻乐
  • 1