AI在线 AI在线

谷歌更新 Gemini 2.5 Pro 预览版模型至 06-05 版本,多项 AI 性能基准测试评分提升

谷歌于今年 3 月底发布了 Gemini 2.5 Pro 模型,紧接着又在 4 月推出了面向更广泛用户的轻量级版本 Gemini 2.5 Flash。两者目前仍处于预览阶段,但 Flash 版本已可通过 Gemini App 向全球用户开放体验。目前,谷歌再度更新 Google AI Studio 中的 Gemin 2.5 Pro 模型(更新至 06-05 版本),并声称该模型刷新了多项 AI 性能基准“跑分”
感谢谷歌于今年 3 月底发布了 Gemini 2.5 Pro 模型,紧接着又在 4 月推出了面向更广泛用户的轻量级版本 Gemini 2.5 Flash。两者目前仍处于预览阶段,但 Flash 版本已可通过 Gemini App 向全球用户开放体验。

目前,谷歌再度更新 Google AI Studio 中的 Gemin 2.5 Pro 预览版模型(AI在线注:更新至 06-05 版本),并声称该模型刷新了多项 AI 性能基准“跑分”:

  • LMArena Elo 评分上升 24 分

  • WebDevArena Elo 评分上升 35 分至 1443 分,取得业界领先地位

  • 在 GPQA 和 Humanity's Last Exam 等高难度测试中“表现出色”

谷歌更新 Gemini 2.5 Pro 预览版模型至 06-05 版本,多项 AI 性能基准测试评分提升

谷歌还回应了上一个 Gemini 2.5 Pro 预览版(05-06 版本)用户们对于“模型性能短暂下滑”的抱怨,声称模型“已在风格与结构方面进行了优化”,使模型“更具创意、回答格式更清晰”,提升了交互体验。

值得注意的是,谷歌近期还放宽了 Pro 版用户的请求限制(query limits),这也许预示着该版本在本月正式上线后会有更具吸引力的价格策略。

相关资讯

29 年经典游戏被攻克:谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》

谷歌Gemini 2.5 Pro成功通关29年前的经典游戏《宝可梦蓝》,展示了AI在游戏领域的突破。谷歌CEO皮查伊兴奋宣布这一成果,引发对AI游戏能力的讨论。#AI游戏# #Gemini#
5/4/2025 7:55:19 AM
远洋

用AI把一段视频变成可视化网页,Google的新模型又卷飞了!

Google 也不知道受了什么刺激,最近在 AI 场上,好像越来越有站起来的意思了。 之前我就写过 Gemini 2.5 pro,是在聊天记录可视化的文章里。 被低估的谷歌?
5/8/2025 1:13:04 AM
数字生命卡兹克

Perplexity 竞技场夺冠,Sonar挑战谷歌Gemini的搜索霸主地位

在最新的 LM Arena Search Arena 评估中,Perplexity 公司的 Sonar-Reasoning-Pro-High 模型表现优异,与谷歌的 Gem-2.5-Pro-Grounding 模型并列第一,直接对决的胜率达到53%。 这一消息无疑给搜索引擎领域带来了新的震动,显示了 Perplexity 在 AI 搜索技术上的强大实力。 Sonar 系列模型在此次评估中包揽了前四名,这不仅彰显了其深度搜索能力,也显示了其在严谨引证方面的出色表现。
4/16/2025 4:01:05 PM
AI在线
  • 1