AI奥赛金牌战:OpenAI与谷歌DeepMind上演“气氛”对决，谁是真赢家?

作者：AI在线 2025-07-22 11:03

近日，人工智能领域两大巨头OpenAI和谷歌DeepMind相继宣布，其AI模型在2025年国际数学奥林匹克竞赛（IMO）中荣获金牌。这一成就不仅彰显了人工智能系统惊人的发展速度，也意外点燃了两家公司之间一场关乎“领先地位”认知的激烈竞争。 IMO作为全球历史最悠久、最具挑战性的高中数学竞赛之一，其结果被视为衡量人工智能推理能力的重要基准。

近日，人工智能领域两大巨头OpenAI和谷歌DeepMind相继宣布，其AI模型在2025年国际数学奥林匹克竞赛（IMO）中荣获金牌。这一成就不仅彰显了人工智能系统惊人的发展速度，也意外点燃了两家公司之间一场关乎“领先地位”认知的激烈竞争。

IMO作为全球历史最悠久、最具挑战性的高中数学竞赛之一，其结果被视为衡量人工智能推理能力的重要基准。去年，谷歌以一个需要人工协助的“正式”系统在IMO中摘得银牌。而今年，OpenAI和谷歌都推出了更先进的**“非正式”系统**，这些系统能够直接从自然语言问题中提取信息，并生成有理有据的答案，无需人工转换。两家公司均声称，其AI模型在IMO考试中正确回答了六道题中的五道，超越了多数高中生和谷歌去年的AI模型表现。

机器人对决

推理模型突破与争议

在接受采访时，OpenAI和谷歌IMO项目的研究人员表示，这些金牌成绩代表了AI推理模型在不可验证领域的突破。这尤其重要，因为传统的AI推理模型擅长解决答案明确的问题（如简单数学或编程），但在解决方案模糊的任务上(如协助复杂研究)则表现欠佳。

然而，围绕此次金牌成绩的**“谁先宣布”和“如何宣布”**，两家公司爆发了激烈的争执。OpenAI在周六早上率先公布其AI模型获得金牌的消息，此举立即引来了谷歌DeepMind首席执行官和研究人员的批评。谷歌DeepMind高级研究员、IMO项目负责人Thang Luong向TechCrunch表示，谷歌选择等待官方结果公布是为了尊重参赛学生，并已与国际数学奥林匹克组织者合作准备考试，并于周一上午才公布了官方结果，该结果获得了IMO主席和官方评分的支持。Luong强调:“国际数学奥林匹克组织者有自己的评分标准。所以，任何不基于该标准的评估都不能声称其成绩达到了金牌水平。”

各执一词，竞争白热化

OpenAI参与IMO模型开发的Noam Brown则解释称，IMO数月前曾邀请OpenAI参加正式竞赛，但因当时专注于开发更具研究价值的自然语言系统而婉拒。Brown表示，OpenAI并不知晓IMO正与谷歌进行非正式测试。OpenAI方面称，他们聘请了三位熟悉评分系统的前IMO奖牌获得者作为第三方评估员，来评估其AI模型的表现。在得知金牌成绩后，OpenAI联系了IMO，但IMO建议其等到周五晚上的颁奖典礼结束后再公布结果。IMO方面尚未对TechCrunch的置评请求做出回应。

尽管谷歌在程序上或许更为严谨，但这场争论的背后，是全球领先AI实验室模型飞速进步的宏大图景。今年全球顶尖高中生齐聚IMO，但只有少数人的得分能与OpenAI和谷歌的AI模型匹敌。这表明，曾经遥遥领先的OpenAI，如今正面临着一场比以往任何时候都更加激烈的竞争。随着OpenAI预计在未来几个月发布GPT-5，维持其在AI领域的领先地位形象，无疑是当前“气氛”之战的关键所在。

谷歌 Gemini 高级版震撼登场！斩获 IMO 2025 金牌，数学奥林匹克的全新挑战者！

谷歌 DeepMind 近日宣布，其最新的 Gemini 高级版 AI 模型在2025年国际数学奥林匹克（IMO）竞赛中表现优异，成功获得金牌。这一成就不仅让人瞩目，更是对 AI 技术在复杂问题解决能力上一次质的飞跃。据了解，这一荣誉的获得并非易事。

7/22/2025 11:03:04 AM AI在线

“那题我也没解出”：陶哲轩寄语 IMO 闭幕式，谈金牌、友情与勇气

大数据文摘出品今年这届 IMO 无比热闹，先是中国代表队六人全部获得金牌，以总分231分，列全球第一。然后，AI 也首次站上IMO金牌线：谷歌DeepMind宣布，其最新模型Gemini Deep Think取得35分，成功获得IMO官方认证的金牌成绩。这是AI历史上第一次在数学奥赛中达到这一高度。

7/24/2025 4:30:48 PM

银牌组最高分，谷歌 DeepMind 捅破 AI 数学推理上限：6 道国际奥数题解出 4 道

IT 之家 7 月 26 日消息，谷歌 DeepMind 团队昨日（7 月 25 日）发布博文，表示其研发的 AlphaProof 和 AlphaGeometry 2 模型可以解决数学中的高级推理问题，在解答国际数学奥林匹克竞赛难题方面达到银牌标准。AI 模型简介AlphaProof：基于强化学习的全新数学形式推理系统。AlphaGeometry 2：几何解题系统的改进版。DeepMind 团队结合两个 AI 模型，协作解决了今年国际数学奥林匹克（IMO）6 道题目中的 4 道，首次在竞赛中取得与银牌得主同等的成绩

7/26/2024 9:34:54 AM 故渊