AI在线 AI在线

AI奥赛金牌战:OpenAI与谷歌DeepMind上演“气氛”对决,谁是真赢家?

近日,人工智能领域两大巨头OpenAI和谷歌DeepMind相继宣布,其AI模型在2025年国际数学奥林匹克竞赛(IMO)中荣获金牌。 这一成就不仅彰显了人工智能系统惊人的发展速度,也意外点燃了两家公司之间一场关乎“领先地位”认知的激烈竞争。 IMO作为全球历史最悠久、最具挑战性的高中数学竞赛之一,其结果被视为衡量人工智能推理能力的重要基准。

近日,人工智能领域两大巨头OpenAI和谷歌DeepMind相继宣布,其AI模型在2025年国际数学奥林匹克竞赛(IMO)中荣获金牌。这一成就不仅彰显了人工智能系统惊人的发展速度,也意外点燃了两家公司之间一场关乎“领先地位”认知的激烈竞争。

IMO作为全球历史最悠久、最具挑战性的高中数学竞赛之一,其结果被视为衡量人工智能推理能力的重要基准。去年,谷歌以一个需要人工协助的“正式”系统在IMO中摘得银牌。而今年,OpenAI和谷歌都推出了更先进的**“非正式”系统**,这些系统能够直接从自然语言问题中提取信息,并生成有理有据的答案,无需人工转换。两家公司均声称,其AI模型在IMO考试中正确回答了六道题中的五道,超越了多数高中生和谷歌去年的AI模型表现。

机器人对决

推理模型突破与争议

在接受采访时,OpenAI和谷歌IMO项目的研究人员表示,这些金牌成绩代表了AI推理模型在不可验证领域的突破。这尤其重要,因为传统的AI推理模型擅长解决答案明确的问题(如简单数学或编程),但在解决方案模糊的任务上(如协助复杂研究)则表现欠佳。

然而,围绕此次金牌成绩的**“谁先宣布”和“如何宣布”**,两家公司爆发了激烈的争执。OpenAI在周六早上率先公布其AI模型获得金牌的消息,此举立即引来了谷歌DeepMind首席执行官和研究人员的批评。谷歌DeepMind高级研究员、IMO项目负责人Thang Luong向TechCrunch表示,谷歌选择等待官方结果公布是为了尊重参赛学生,并已与国际数学奥林匹克组织者合作准备考试,并于周一上午才公布了官方结果,该结果获得了IMO主席和官方评分的支持。Luong强调:“国际数学奥林匹克组织者有自己的评分标准。所以,任何不基于该标准的评估都不能声称其成绩达到了金牌水平。”

各执一词,竞争白热化

OpenAI参与IMO模型开发的Noam Brown则解释称,IMO数月前曾邀请OpenAI参加正式竞赛,但因当时专注于开发更具研究价值的自然语言系统而婉拒。Brown表示,OpenAI并不知晓IMO正与谷歌进行非正式测试。OpenAI方面称,他们聘请了三位熟悉评分系统的前IMO奖牌获得者作为第三方评估员,来评估其AI模型的表现。在得知金牌成绩后,OpenAI联系了IMO,但IMO建议其等到周五晚上的颁奖典礼结束后再公布结果。IMO方面尚未对TechCrunch的置评请求做出回应。

尽管谷歌在程序上或许更为严谨,但这场争论的背后,是全球领先AI实验室模型飞速进步的宏大图景。今年全球顶尖高中生齐聚IMO,但只有少数人的得分能与OpenAI和谷歌的AI模型匹敌。这表明,曾经遥遥领先的OpenAI,如今正面临着一场比以往任何时候都更加激烈的竞争。随着OpenAI预计在未来几个月发布GPT-5,维持其在AI领域的领先地位形象,无疑是当前“气氛”之战的关键所在。

相关资讯

谷歌 Gemini 高级版震撼登场!斩获 IMO 2025 金牌,数学奥林匹克的全新挑战者!

谷歌 DeepMind 近日宣布,其最新的 Gemini 高级版 AI 模型在2025年国际数学奥林匹克(IMO)竞赛中表现优异,成功获得金牌。 这一成就不仅让人瞩目,更是对 AI 技术在复杂问题解决能力上一次质的飞跃。 据了解,这一荣誉的获得并非易事。
7/22/2025 11:03:04 AM
AI在线

“那题我也没解出”:陶哲轩寄语 IMO 闭幕式,谈金牌、友情与勇气

大数据文摘出品今年这届 IMO 无比热闹,先是中国代表队六人全部获得金牌,以总分231分,列全球第一。 然后,AI 也首次站上IMO金牌线:谷歌DeepMind宣布,其最新模型Gemini Deep Think取得35分,成功获得IMO官方认证的金牌成绩。 这是AI历史上第一次在数学奥赛中达到这一高度。
7/24/2025 4:30:48 PM

银牌组最高分,谷歌 DeepMind 捅破 AI 数学推理上限:6 道国际奥数题解出 4 道

IT 之家 7 月 26 日消息,谷歌 DeepMind 团队昨日(7 月 25 日)发布博文,表示其研发的 AlphaProof 和 AlphaGeometry 2 模型可以解决数学中的高级推理问题,在解答国际数学奥林匹克竞赛难题方面达到银牌标准。AI 模型简介AlphaProof:基于强化学习的全新数学形式推理系统。AlphaGeometry 2:几何解题系统的改进版。DeepMind 团队结合两个 AI 模型,协作解决了今年国际数学奥林匹克(IMO)6 道题目中的 4 道,首次在竞赛中取得与银牌得主同等的成绩
7/26/2024 9:34:54 AM
故渊
  • 1