AI在线 AI在线

​谷歌发布Gemini2.5Pro预览版:编码性能击败DeepSeek R1和Grok 3 Beta

谷歌近日推出了其最新的 Gemini2.5Pro 预览版,这款被誉为 “最智能” 模型的产品,首次在3月份宣布,随后在5月份进行了升级。 此次发布的预览版旨在为企业提供一个测试新应用程序或替换早期版本的机会。 根据谷歌的官方博客,这一新版本在回应速度和创意上表现更佳,同时在编码和推理能力上超越了其他模型。

谷歌近日推出了其最新的 Gemini2.5Pro 预览版,这款被誉为 “最智能” 模型的产品,首次在3月份宣布,随后在5月份进行了升级。此次发布的预览版旨在为企业提供一个测试新应用程序或替换早期版本的机会。根据谷歌的官方博客,这一新版本在回应速度和创意上表现更佳,同时在编码和推理能力上超越了其他模型。

image.png

在5月份的 I/O 开发者大会上,谷歌透露,Gemini2.5Pro 的升级使其性能有了显著提高。谷歌 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis)表示,I/O 版是该公司迄今为止最好的编码模型。然而,此次的 Gemini2.5Pro Preview06-05Thinking 比 I/O 版更为出色,已准备好满足企业级应用的需求。

新版本的 Gemini2.5Pro 在性能测试中表现优异,相较于早期版本,LMArena 测试分数提高了24分,WebDevArena 则提升了35分,当前在排行榜上名列前茅。谷歌的基准测试显示,该模型在编码能力上超过了 OpenAI 的 o3、o3-mini、o4-mini,Anthropic 的 Claude4Opus,以及 xAI 的 Grok3Beta 和 DeepSeek R1等竞争对手。

image.png

谷歌在其博客中指出,他们已根据前期版本的反馈,改进了 Gemini2.5Pro 的风格和结构,使其在回应上更具创意且格式更加规范。尽管谷歌在不断改进 Gemini2.5Pro,但这对许多用户来说可能会造成一定困惑。新版本的定价为每百万个 tokens $1.25(不含输入缓存),输出价格为 $10。

自3月份 Gemini2.5Pro 首次发布以来,这款模型已被广泛集成到许多新应用和服务中,包括 “Deep Think”,该功能使 Gemini 在回应前可以考虑多个假设。在 Gemini2.5Pro 及其两次升级版本发布后,谷歌重新在大型语言模型市场上占据了一席之地,此前的市场注意力更多地集中在 DeepSeek 和 OpenAI 等竞争对手的推理模型上。

在更新发布的短短几小时内,开发者们已经开始探索这一新版本。虽然许多人认为更新确实如谷歌所承诺的那样更快,但关于 Gemini2.5Pro 的实际性能提升尚需进一步验证。

划重点:

🌟 谷歌推出了新的 Gemini2.5Pro 预览版,声称在编码性能上超越了主要竞争对手。  

🚀 新版本在多个性能测试中得分大幅提升,特别是在 LMArena 和 WebDevArena 中表现突出。  

💰 定价信息为每百万 tokens $1.25,输出价格为 $10,企业可以在 Google AI Studio 和 Vertex AI 平台上使用该模型。

相关资讯

谷歌推出更新版 Gemini 2.5 Pro,AI 性能大幅提升

谷歌最近在其 AI 模型系列中迎来了重要更新。 继今年3月底推出 Gemini2.5Pro 模型后,谷歌紧接着在4月发布了更为轻量的 Gemini2.5Flash 版本。 虽然两者目前都处于预览阶段,但 Gemini2.5Flash 版本已经通过 Gemini App 向全球用户开放,用户可以体验其强大的功能。
6/6/2025 9:00:55 AM
AI在线

Gemini 2.5 Pro即将更新Deep Think的功能 提供额外计算能力

随着人工智能技术的迅猛发展,Google的Gemini系列模型持续引领行业创新。 AIbase最新获悉,Gemini2.5Pro即将正式发布全新“Deep Think”功能,这一增强推理模式被誉为AI复杂问题解决的里程碑。 Deep Think功能:多线程推理的突破根据近期社交媒体上的可靠信息,Gemini2.5Pro的Deep Think模式通过并行处理多个假设,显著提升了模型在复杂任务中的推理能力。
6/17/2025 11:02:12 PM
AI在线

谷歌重磅发布 Gemini CLI!AI 助手直击开发者终端

近日,谷歌正式推出了全新的命令行工具 ——Gemini CLI。 这款工具基于谷歌自家研发的 Gemini2.5Pro AI 模型,旨在为开发者提供便捷的 AI 问答与内容生成服务。 借助 Gemini CLI,开发者可以在自己的终端界面中直接调用 AI 的强大能力,从而提升编程效率和工作便捷性。
6/26/2025 11:00:48 AM
AI在线
  • 1