出品 | 51CTO技术栈(微信号:blog51cto)
AI 编码模型的新王者登基了!今天,Google 旗下的 DeepMind AI 研究部门正式发布了 Gemini 2.5 Pro “I/O” 版,这是今年 3 月推出的 Gemini 2.5 Pro 多模态大语言模型(LLM)的更新版本。
DeepMind CEO Demis Hassabis 在 X 上表示:“这是我们迄今为止打造的最佳编码模型!”
在 WebDev Arena 榜单(一个基于人类偏好、评估模型生成美观且实用 Web 应用能力的第三方指标)上,Gemini 2.5 Pro Preview(05-06)现已超越 Anthropic 的 Claude 3.7 Sonnet,登顶第一。
此次更新的最大亮点,在于模型能仅通过一句提示生成完整、可交互的 Web 应用或模拟项目,根据草图完成应用的编程等等。这正符合 DeepMind 一贯强调的“简化原型开发流程”的愿景。
新版本模型进一步助力应用中的功能开发,能够自动匹配组件的视觉风格,还能实现如将 YouTube 视频转换为功能齐全的学习应用、或用极少甚至无需 CSS 手动编辑就创建出响应式视频播放器或动态语音 UI 等工作流。
这款新版本标识为 “gemini-2.5-pro-preview-05-06”,取代了之前的 03-25 版本,现在已面向独立开发者开放(通过 Google AI Studio),也面向企业客户上线(通过 Vertex AI 云平台),同时普通用户可在 Gemini App 中体验。Google 在博客中指出,新模型还为 Gemini 移动端的 Canvas 画布功能及其他组件提供支持。
该模型为闭源专有模式,企业需要付费使用,仅可通过 Google 的 Web 服务访问。不过它并未改变价格或速率限制,当前 Gemini 2.5 Pro 用户将自动切换至新版本。价格为每百万输入/输出 token 分别为 $1.25 / $10(上下文长度为 200,000 token),而 Claude 3.7 Sonnet 的对应价格为 $3 / $15。