AI在线 AI在线

Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用

出品 | 51CTO技术栈(微信号:blog51cto)AI 编码模型的新王者登基了! 今天,Google 旗下的 DeepMind AI 研究部门正式发布了 Gemini 2.5 Pro “I/O” 版,这是今年 3 月推出的 Gemini 2.5 Pro 多模态大语言模型(LLM)的更新版本。 DeepMind CEO Demis Hassabis 在 X 上表示:“这是我们迄今为止打造的最佳编码模型!

出品 | 51CTO技术栈(微信号:blog51cto)

AI 编码模型的新王者登基了!今天,Google 旗下的 DeepMind AI 研究部门正式发布了 Gemini 2.5 Pro “I/O” 版,这是今年 3 月推出的 Gemini 2.5 Pro 多模态大语言模型(LLM)的更新版本。

Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用

DeepMind CEO Demis Hassabis 在 X 上表示:“这是我们迄今为止打造的最佳编码模型!”

Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用

在 WebDev Arena 榜单(一个基于人类偏好、评估模型生成美观且实用 Web 应用能力的第三方指标)上,Gemini 2.5 Pro Preview(05-06)现已超越 Anthropic 的 Claude 3.7 Sonnet,登顶第一。

Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用

此次更新的最大亮点,在于模型能仅通过一句提示生成完整、可交互的 Web 应用或模拟项目,根据草图完成应用的编程等等。这正符合 DeepMind 一贯强调的“简化原型开发流程”的愿景。

Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用

新版本模型进一步助力应用中的功能开发,能够自动匹配组件的视觉风格,还能实现如将 YouTube 视频转换为功能齐全的学习应用、或用极少甚至无需 CSS 手动编辑就创建出响应式视频播放器或动态语音 UI 等工作流。

Gemini 2.5 Pro再更新!编程能力屠榜!一句话、一张草图变应用

这款新版本标识为 “gemini-2.5-pro-preview-05-06”,取代了之前的 03-25 版本,现在已面向独立开发者开放(通过 Google AI Studio),也面向企业客户上线(通过 Vertex AI 云平台),同时普通用户可在 Gemini App 中体验。Google 在博客中指出,新模型还为 Gemini 移动端的 Canvas 画布功能及其他组件提供支持。

该模型为闭源专有模式,企业需要付费使用,仅可通过 Google 的 Web 服务访问。不过它并未改变价格或速率限制,当前 Gemini 2.5 Pro 用户将自动切换至新版本。价格为每百万输入/输出 token 分别为 $1.25 / $10(上下文长度为 200,000 token),而 Claude 3.7 Sonnet 的对应价格为 $3 / $15。

相关资讯

谷歌大招网友玩疯了!Gemini原生图像输出抢先推出,OpenAI一年领先优势归零

谷歌推出Gemini原生图像生成,测试版瞬间引爆网络。 如果你迟到了,但没有好的借口,甚至还没有出家门——只需要一张自拍,然后让AI把你P到地铁故障现场。 图片也可以凭空生成一个人物形象,把它放到原神游戏画面中(不用上传游戏截图),让角色往前走两步,再把视角往左移,走近一个建筑,开始爬墙。
3/14/2025 12:14:38 PM

大语言模型究竟为何会在对话中“迷失”​

译者 | 张哲刚审校 | 重楼微软研究院和 Salesforce的一篇新论文发现,即使是功能最强大的大型语言模型,如果面临的指令是分阶段而非一次性给出,往往也会表现不佳。 该文作者运行六项任务进行研究,最终发现:当提示被拆分成多个回合时,大语言模型的性能平均下降了39%。 单轮次对话(左图)可获得最佳结果,但对最终用户而言显得并不自然。
5/23/2025 8:18:52 AM
张哲刚

91.1% 准确率,性能远超 GPT-4 系列模型,谷歌推出多模态医学大模型 Med-Gemini

编辑 | 萝卜皮各种复杂的医疗应用给人工智能带来了巨大挑战:需要先进的推理、获取最新的医学知识以及对复杂的多模态数据的理解。Gemini 模型在多模态和长上下文推理方面具有强大的通用能力,为 AI 在医学领域应用提供了可能性。基于 Gemini 的核心优势,谷歌的研究人员推出了 Med-Gemini,这是一个功能强大的多模态模型系列,专门用于医学,能够无缝使用网络搜索,并且可以使用自定义编码器有效地针对新颖的模态进行定制。研究人员用 14 项医疗基准评估 Med-Gemini,在其中 10 项上建立了新的最先进(S
5/7/2024 6:43:00 PM
ScienceAI
  • 1