35分斩金！Gemini 成首个 IMO 认证 AI 金牌，OpenAI 未获许可强蹭 IMO 热度

Gemini Deep Think正式跨入国际数学奥林匹克（IMO）金牌行列。谷歌DeepMind宣布，其搭载Deep Think模式的先进版本Gemini，在2025年IMO中斩获35分，成功达到了金牌标准。这一成绩来自对6道题中的5道完美解答，评分标准、比赛时间、参赛流程与人类选手完全一致。

Gemini Deep Think正式跨入国际数学奥林匹克（IMO）金牌行列。

谷歌DeepMind宣布，其搭载Deep Think模式的先进版本Gemini，在2025年IMO中斩获35分，成功达到了金牌标准。

这一成绩来自对6道题中的5道完美解答，评分标准、比赛时间、参赛流程与人类选手完全一致。

图片

更关键的是，这是IMO官方首次对AI参赛结果进行正式认证，并给出与学生相同的评分机制。

IMO主席Gregor Dolinar明确表示：“我们可以确认，Google DeepMind达到了这一备受期待的里程碑。解答清晰、精准，大多数都易于理解。”

图片

要知道，去年的银牌得主是DeepMind旗下的AlphaProof与AlphaGeometry组合系统，用了两到三天的时间、依赖形式语言翻译，才完成28分的成绩。

今年的Gemini Deep Think，在4.5小时内用英语读题、用英语写出完整证明，全程自然语言，端到端完成任务，完成了从“翻译数学”到“思维数学”的跨越。

DeepMind科学家Thang Luong称，这是AI在数学理解领域的“范式转变”。

更引人注目的是，这款Gemini新模型尚未公开，但DeepMind已承诺将先开放给受信任的数学家进行测试，后续逐步向Google AI Ultra用户推出。

一、技术之上，是节奏与分寸

然而，在DeepMind宣布突破之前，另一场围绕“谁先发声”的风波，先点燃了整个AI圈。

知情者透露，DeepMind其实在7月19日（周五）下午就完成了内部验证。但为了配合IMO官方“闭幕式后一周再公布”的非正式约定，他们决定等到下周一再正式发布。

图片

没想到，OpenAI在19日凌晨突然宣布：“我们也做到了！”

结果，所有注意力一夜之间倾斜向了OpenAI，DeepMind的节奏被彻底打乱。

社交平台瞬间炸开了锅。有推特网友一针见血地指出：“在这个游戏里，速度大于官僚主义。错过时机，你就失去了话语权。”

而据IMO相关协调员透露，OpenAI并未与IMO官方合作测试其模型，可能“并不知道”需要等待闭幕式之后才宣布。

图片

OpenAI研究员Noam Brown随后澄清称，他们确实在闭幕式结束后才公布成绩，并事先知会了部分组织者。

但据IMO内部人员披露，OpenAI其实在闭幕晚会前就公布了结果，这种行为被评价为“粗鲁和不恰当”。

图片

DeepMind CEO哈萨比斯虽然在推文中“只字未提”OpenAI，却通过强调三个点回应了全部质疑：我们没有抢跑，成绩是IMO官方认证，模型也会正式发布。

这三点，恰恰击中了OpenAI的三个软肋。

不仅DeepMind的节奏更体面，他们在技术层面也选择了更高成本、更针对性的AI模型研发路径。

Gemini Deep Think并非通用模型，而是一个专为复杂问题设计的增强推理系统，融合了DeepMind最新的研究成果。

而OpenAI的做法，则被不少网友评价为“通用模型，低资源，博营销”。

二、增强推理，迈向直觉

图片

Gemini Deep Think最核心的优势，来自它独特的“并行思维”能力。

在解题过程中，模型不再像传统AI那样顺着一条逻辑线推演，而是同时展开多个可能的解法路径，并在最终组合成最优方案后给出答案。

这让它拥有比人类更广阔的思维幅度，又不失推理的严谨性。

此外，为进一步发挥推理能力，DeepMind采用了多项技术升级：使用全新的强化学习方式训练模型；提供高质量的数学问题和解答数据集；加入专门的IMO题目解题提示与策略指令。

更惊人的是，在今年的第三题中，大部分人类选手使用了研究生级别的技巧完成，而Gemini仅用初等数论，就完成了一个逻辑自洽的完整证明。

至于那唯一没有解出的第六题？据说人类选手中也仅有五人解出。Gemini只是“选错了方向”。

目前，DeepMind已将Gemini解答的五道题目完整公开，接受全网检验。

与Gemini Deep Think同时被提及的，还有DeepMind之前的形式化系统：AlphaProof和AlphaGeometry。

图片

虽然今年Gemini完全依赖自然语言完成任务，但DeepMind明确表示，这两条路线仍会并行推进。

他们的目标，是构建一个既能理解人类语言，又能进行严格形式证明的“超级数学助手”。

这种AI，将不止用于数学竞赛，还能成为科学研究、工程设计、理论建模等领域的核心工具。

35分斩金！Gemini 成首个 IMO 认证 AI 金牌，OpenAI 未获许可强蹭 IMO 热度

一、技术之上，是节奏与分寸

二、增强推理，迈向直觉

相关资讯

IMO怒斥OpenAI自封夺金，“91位评委均未参与评分”，网友：炒作无下限

OpenAI被曝IMO金牌「造假」，陶哲轩怒揭内幕！

AI Gold Medal Showdown: OpenAI vs. Google DeepMind in a Tense Competition, Who is the True Winner?

35分斩金！Gemini 成首个 IMO 认证 AI 金牌 ，OpenAI 未获许可强蹭 IMO 热度

一、技术之上，是节奏与分寸

二、增强推理，迈向直觉

相关资讯

IMO怒斥OpenAI自封夺金，“91位评委均未参与评分”，网友：炒作无下限

OpenAI被曝IMO金牌「造假」，陶哲轩怒揭内幕！

AI Gold Medal Showdown: OpenAI vs. Google DeepMind in a Tense Competition, Who is the True Winner?

35分斩金！Gemini 成首个 IMO 认证 AI 金牌，OpenAI 未获许可强蹭 IMO 热度