AI在线 AI在线

35分斩金!Gemini 成首个 IMO 认证 AI 金牌 ,OpenAI 未获许可强蹭 IMO 热度

Gemini Deep Think正式跨入国际数学奥林匹克(IMO)金牌行列。 谷歌DeepMind宣布,其搭载Deep Think模式的先进版本Gemini,在2025年IMO中斩获35分,成功达到了金牌标准。 这一成绩来自对6道题中的5道完美解答,评分标准、比赛时间、参赛流程与人类选手完全一致。

Gemini Deep Think正式跨入国际数学奥林匹克(IMO)金牌行列。

谷歌DeepMind宣布,其搭载Deep Think模式的先进版本Gemini,在2025年IMO中斩获35分,成功达到了金牌标准。

这一成绩来自对6道题中的5道完美解答,评分标准、比赛时间、参赛流程与人类选手完全一致。

图片图片

更关键的是,这是IMO官方首次对AI参赛结果进行正式认证,并给出与学生相同的评分机制。

IMO主席Gregor Dolinar明确表示:“我们可以确认,Google DeepMind达到了这一备受期待的里程碑。解答清晰、精准,大多数都易于理解。”

图片图片

要知道,去年的银牌得主是DeepMind旗下的AlphaProof与AlphaGeometry组合系统,用了两到三天的时间、依赖形式语言翻译,才完成28分的成绩。

今年的Gemini Deep Think,在4.5小时内用英语读题、用英语写出完整证明,全程自然语言,端到端完成任务,完成了从“翻译数学”到“思维数学”的跨越。

DeepMind科学家Thang Luong称,这是AI在数学理解领域的“范式转变”。

更引人注目的是,这款Gemini新模型尚未公开,但DeepMind已承诺将先开放给受信任的数学家进行测试,后续逐步向Google AI Ultra用户推出。

一、技术之上,是节奏与分寸

然而,在DeepMind宣布突破之前,另一场围绕“谁先发声”的风波,先点燃了整个AI圈。

知情者透露,DeepMind其实在7月19日(周五)下午就完成了内部验证。但为了配合IMO官方“闭幕式后一周再公布”的非正式约定,他们决定等到下周一再正式发布。

图片图片

没想到,OpenAI在19日凌晨突然宣布:“我们也做到了!”

结果,所有注意力一夜之间倾斜向了OpenAI,DeepMind的节奏被彻底打乱。

社交平台瞬间炸开了锅。有推特网友一针见血地指出:“在这个游戏里,速度大于官僚主义。错过时机,你就失去了话语权。”

而据IMO相关协调员透露,OpenAI并未与IMO官方合作测试其模型,可能“并不知道”需要等待闭幕式之后才宣布。

图片图片

OpenAI研究员Noam Brown随后澄清称,他们确实在闭幕式结束后才公布成绩,并事先知会了部分组织者。

但据IMO内部人员披露,OpenAI其实在闭幕晚会前就公布了结果,这种行为被评价为“粗鲁和不恰当”。

图片图片

DeepMind CEO哈萨比斯虽然在推文中“只字未提”OpenAI,却通过强调三个点回应了全部质疑:我们没有抢跑,成绩是IMO官方认证,模型也会正式发布。

这三点,恰恰击中了OpenAI的三个软肋。

不仅DeepMind的节奏更体面,他们在技术层面也选择了更高成本、更针对性的AI模型研发路径。

Gemini Deep Think并非通用模型,而是一个专为复杂问题设计的增强推理系统,融合了DeepMind最新的研究成果。

而OpenAI的做法,则被不少网友评价为“通用模型,低资源,博营销”。

二、增强推理,迈向直觉

图片图片

Gemini Deep Think最核心的优势,来自它独特的“并行思维”能力。

在解题过程中,模型不再像传统AI那样顺着一条逻辑线推演,而是同时展开多个可能的解法路径,并在最终组合成最优方案后给出答案。

这让它拥有比人类更广阔的思维幅度,又不失推理的严谨性。

此外,为进一步发挥推理能力,DeepMind采用了多项技术升级:使用全新的强化学习方式训练模型;提供高质量的数学问题和解答数据集;加入专门的IMO题目解题提示与策略指令。

更惊人的是,在今年的第三题中,大部分人类选手使用了研究生级别的技巧完成,而Gemini仅用初等数论,就完成了一个逻辑自洽的完整证明。

至于那唯一没有解出的第六题?据说人类选手中也仅有五人解出。Gemini只是“选错了方向”。

目前,DeepMind已将Gemini解答的五道题目完整公开,接受全网检验。

与Gemini Deep Think同时被提及的,还有DeepMind之前的形式化系统:AlphaProof和AlphaGeometry。

图片图片

虽然今年Gemini完全依赖自然语言完成任务,但DeepMind明确表示,这两条路线仍会并行推进。

他们的目标,是构建一个既能理解人类语言,又能进行严格形式证明的“超级数学助手”。

这种AI,将不止用于数学竞赛,还能成为科学研究、工程设计、理论建模等领域的核心工具。

相关资讯

IMO怒斥OpenAI自封夺金,“91位评委均未参与评分”,网友:炒作无下限

OpenAI声称新模型获得IMO金牌不到24小时,剧情就出现了大反转! 多位IMO官方人士和学界大佬纷纷发声,直指OpenAI的做法“粗鲁且不恰当”。 IMO主办方要求AI公司在闭幕式一周后再公布结果,让关注的焦点留在参赛的青少年上,然而OpenAI偏偏选择在闭幕式刚结束就急不可耐地宣布了成绩。
7/21/2025 2:27:44 PM

OpenAI被曝IMO金牌「造假」,陶哲轩怒揭内幕!

OpenAI夺下IMO金牌,最新大瓜又来了。 昨日,因内部审核流程,谷歌DeepMind研究员在评论区,暗讽OpenAI抢先发布测试结果。 图片原来,事情并非那么简单。
7/21/2025 11:48:54 AM
新智元

AI Gold Medal Showdown: OpenAI vs. Google DeepMind in a Tense Competition, Who is the True Winner?

Recently, two major giants in the artificial intelligence field, OpenAI and Google DeepMind, have announced that their AI models won gold medals in the 2025 International Mathematical Olympiad (IMO).
7/22/2025 9:52:46 AM
AI在线
  • 1