AI在线 AI在线

震撼!OpenAI在2025国际大学生程序设计竞赛拿下满分夺得第一,谷歌也取得金牌成绩

在阿塞拜疆巴库举行的 2025年国际大学生程序设计竞赛(ICPC)全球总决赛中上,来自 100 多个国家的 139 支大学队伍在五小时内角逐解决 12 个算法问题,最终圣彼得堡国立大学凭借解决 11 个算法问题夺得人类冠军。 在相同约束条件下的并行 AI 赛道上,谷歌的 Gemini 2.5 Deep Think 模型解决了 10 个问题,获得了与金牌相当的成绩。 最震撼的是OpenAI 的内部推理模型获得了 12 /12的满分,超越了所有人类队伍,拿下第一值得注意的是OpenAI和谷歌的模型都解决了所有人类参赛队伍都没有解决的问题c。

在阿塞拜疆巴库举行的 2025年国际大学生程序设计竞赛(ICPC)全球总决赛中上,来自 100 多个国家的 139 支大学队伍在五小时内角逐解决 12 个算法问题,最终圣彼得堡国立大学凭借解决 11 个算法问题夺得人类冠军。在相同约束条件下的并行 AI 赛道上,谷歌的 Gemini 2.5 Deep Think 模型解决了 10 个问题,获得了与金牌相当的成绩。

最震撼的是OpenAI 的内部推理模型获得了 12 /12的满分,超越了所有人类队伍,拿下第一

值得注意的是OpenAI和谷歌的模型都解决了所有人类参赛队伍都没有解决的问题c。OpenAI的内部推理模型在经过9次尝试后解决了最难的问题,其余问题都是一次解决

OpenAI:获满分成绩,超越人类冠军

OpenAI的推理系统在本次竞赛中取得了12题全解的完美成绩,该成绩超过了所有人类参赛队伍

震撼!OpenAI在2025国际大学生程序设计竞赛拿下满分夺得第一,谷歌也取得金牌成绩

成绩与排名:解决了全部12个问题。如果参与人类排名,该成绩将位列第一。本届最优秀的人类队伍解决了11个问题

比赛条件:AI参加了官方的现场AI赛道,与人类选手共享5小时的比赛时限,并接收完全相同的PDF格式题目。系统自主选择并提交答案,无人工干预

解题详情:在12个问题中,11个为一次性提交正确。最难的一个问题在第9次提交后成功解决

震撼!OpenAI在2025国际大学生程序设计竞赛拿下满分夺得第一,谷歌也取得金牌成绩

技术构成:参赛系统由多个通用模型组成,包括GPT-5和一个实验性推理模型。其中,GPT-5解决了11题,实验性推理模型解决了最难的第12题,并负责最终提交决策。所有模型均未针对ICPC进行专门训练

Google DeepMind:获金牌级表现

谷歌DeepMind的Gemini 2.5 Deep Think系统在竞赛中解决了10个问题,达到了金牌级别

震撼!OpenAI在2025国际大学生程序设计竞赛拿下满分夺得第一,谷歌也取得金牌成绩

成绩与排名:解决了12个问题中的10个。该成绩达到了金牌分数线(前四名队伍获金牌),如果参与排名,将位列第二

比赛条件:AI在一个远程在线环境中比赛,遵循ICPC规则,比人类选手晚10分钟开始

关键亮点:独立解决了“Problem C”,这个问题在本次比赛中没有任何一支人类大学队伍能够解决。Gemini在比赛开始后半小时内完成了该题

解题效率:在比赛开始45分钟内解决了8个问题,三小时内完成了全部10个问题

人类队伍排名:

震撼!OpenAI在2025国际大学生程序设计竞赛拿下满分夺得第一,谷歌也取得金牌成绩

震撼!OpenAI在2025国际大学生程序设计竞赛拿下满分夺得第一,谷歌也取得金牌成绩

1.第一名:圣彼得堡国立大学 (St. Petersburg State University)    *   解题数:11    *   总罚时:1478

2.第二名:东京大学 (The University of Tokyo)    *   解题数:10    *   总罚时:1116

3.第三名:北京交通大学 (Beijing Jiaotong University)    *   解题数:10    *   总罚时:1425

4.第四名:清华大学 (Tsinghua University)    *   解题数:9    *   总罚时:865

5.第五名:北京大学 (Peking University)    *   解题数:9    *   总罚时:887

6.第六名:哈佛大学 (Harvard University)    *   解题数:9    *   总罚时:995

7.第七名:萨格勒布大学 (University of Zagreb)    *   解题数:9    *   总罚时:1075

8.第八名:麻省理工学院 (Massachusetts Institute of Technology)    *   解题数:9    *   总罚时:1123

9.第九名:中国科学技术大学 (University of Science and Technology of China)    *   解题数:9    *   总罚时:1128

10.第十名:首尔大学 (Seoul National University)    *   解题数:9    *   总罚时:1133

至此,OpenAI在 IOI 中获得第 6 名,在 AtCoder 竞赛中获得第 2 名ICPC2025上取得了满分,2026年人类的编程能力可能会永远落后于AI,不单单是个人coding能力还包括软件工程能力

相关资讯

谷歌超硬核教科书来了!Jeff Dean带货揭Gemini训练秘籍:在TPU上scaling

由于深度学习的「黑箱」本性,从业者自我调侃道:如果说深度神经网络是现代版的「炼金术」,我们在古代就是「炼金术士」。 2018年5月3日, Science发表新闻,标题直指「炼金术」,强调加强AI的科学基础但这次的谷歌的团队,却有不一样的看法:在许多方面,深度学习仍然带有一定的「炼金术」色彩,但理解和优化模型性能并不一定如此——即使是在大规模环境下! 近日,谷歌DeepMind科学家Jacob Austint在X上, 发布了基于JAX和TPU的大模型Scaling教科书《How to Sacle Your Model》。
2/21/2025 1:45:00 PM
新智元

谷歌Fellow级大佬出走!17年老将吴永辉加盟字节,亲自操刀大模型研发

谷歌17年老将,正式加入字节跳动。 据报道,吴永辉博士已确认离职谷歌,加盟字节负责AI基础研究领域的工作。 他将在字节担任大模型团队Seed基础研究负责人,专注于大模型基础研究搜索、AI for Science科研工作,直接向CEO梁汝波汇报。
2/24/2025 8:15:00 AM
新智元

谷歌Gemma 3上线!单GPU最强多模态手机可跑,27B完胜o3-mini

谷歌Gemma 3全家桶来了! 刚刚,在巴黎开发者日上,开源Gemma系模型正式迭代到第三代,原生支持多模态,128k上下文。 此次,Gemma 3一共开源了四种参数,1B、4B、12B和27B。
3/13/2025 9:12:35 AM
新智元
  • 1