AI在线 AI在线

陶哲轩

解道奥赛题成本5000美元?陶哲轩警告,AI下一步要规模化的「更便宜」

人工智能和数学是密不可分的。 AI 的发展离不开数学的进步,同时 AI 的进步也离不开解决数学问题的能力。 在刚结束不久的 IMO 竞赛中,谷歌的新一代 Gemini 进阶版模型成功解决了六道超高难度试题中的五道,达到了今年 IMO 的金牌水平(35/42),成为首个获得奥赛组委会官方认定为金牌的 AI 系统。
7/25/2025 1:24:00 PM
机器之心

“那题我也没解出”:陶哲轩寄语 IMO 闭幕式,谈金牌、友情与勇气

大数据文摘出品今年这届 IMO 无比热闹,先是中国代表队六人全部获得金牌,以总分231分,列全球第一。 然后,AI 也首次站上IMO金牌线:谷歌DeepMind宣布,其最新模型Gemini Deep Think取得35分,成功获得IMO官方认证的金牌成绩。 这是AI历史上第一次在数学奥赛中达到这一高度。
7/24/2025 4:30:48 PM

先别急着给OpenAI加冕!陶哲轩:这种「金牌」,含金量取决于「赛制」

昨天,OpenAI 官宣了一个重磅消息:他们的一个推理模型在国际数学奥林匹克(IMO)竞赛中获得了金牌水平的表现。 官宣该消息的 OpenAI 研究科学家 Alexander Wei 表示,在评估过程中,研究团队严格按照人类选手的比赛规则进行测试:模型需要在两个 4.5 小时的考试环节中,在没有任何工具或网络辅助的情况下,阅读官方题目并撰写自然语言证明。 在评估中,该模型成功解决了 2025 年 IMO 六道题目中的五道,获得了 35 分(满分 42 分)的成绩,足以获得金牌。
7/20/2025 3:09:00 PM
机器之心

陶哲轩看傻:三破18年数学纪录!谷歌推出「AI爱迪生」,科研不再靠灵感?

5月中旬,谷歌在科学和计算领域投下了重磅炸弹:AlphaEvolve。 利用Gemini模型,它发现全新的算法。 比如说,仅用30天,AlphaEvolve与人类联手三度攻克一项封尘18年的数学难题!
7/14/2025 9:20:00 AM

陶哲轩罕见长长长长长访谈:数学、AI和给年轻人的建议

陶哲轩罕见接受了一次长长长长访谈,把他关于数学、AI、教育和人类智慧的最新认知,都对外分享了。 作为菲尔兹奖得主,陶哲轩一直被认为是当世最伟大的数学家之一,而这次在与MIT技术背景的播客大神Lex Fridman的对话,也是他近年来首次接受超3小时的非学术机构访谈,内容覆盖数学前沿、AI形式化验证、科研方法论等多个硬核议题。 不仅谈论分享了数学和物理相关的专业性观点,还结合当下AI技术迅速发展的背景,作出了很多像基础教育和AI应用的大众话题思考……陶哲轩金句频出,比如:AI和菲尔兹奖的距离,只差一个研究生了。
6/23/2025 8:45:00 AM

刚刚!陶哲轩3小时对话流出:AI抢攻菲尔兹奖倒计时

昨天,陶哲轩公开表示:在未来,AI有可能获得菲尔兹奖。 在时长3小时14分钟的节目中,他还讨论了数学和物理学中最难的问题:纳维–斯托克斯问题  万有理论  广义相对论  孪生素数猜想  费马大定理  考拉兹猜想  P=NP 问题一开始,陶哲轩就认为统一物理理论(比如量子力学与广义相对论)之所以难以进展,是因为还没有找到正确的数学语言。 而AI可能帮助人类实现「大统一理论」,至少也是发现过程中的一部分。
6/16/2025 9:07:00 AM

陶哲轩再爆:一个月三破18年未解难题!AlphaEvolve彻底改写数学研究规则

数学界再次见证奇迹! 一项沉睡了18年的难题,在一个月内竟被AI与人类联手三度突破! 每一次都将我们对可能性的认知推向新高。
6/5/2025 9:06:00 AM

陶哲轩转发!DeepMind开源「AI数学证明标准习题集」

陶哲轩转发,AI搞数学证明的标准习题集来了! DeepMind最新开源形式化数学猜想库——猜想库收录了经典的形式化表述的数学猜想集合,例如,解析数论中的四个朗道问题。 不仅如此,资源库中还提供了各种代码函数,以方便用户对自然语言的数学猜想进行形式化的表述。
6/3/2025 8:15:00 AM

o4-mini暴击六大数学天团,攻破陶哲轩难题!4.5h激战人类阵地失守

八支「数学家天团」和o4-mini-medium同台竞技,谁会最终胜出? 最近,Epoch AI团队举办了一场竞赛,专门考察AI数学能力的进展。 这场比赛邀请了约40位数学精英,分成8组,每组由学科专家和优秀本科生组成。
5/28/2025 10:30:41 AM

陶哲轩联手AI挑战经典ε-δ极限!加法秒杀、乘法翻车

数学大师陶哲轩的AI新实验来了! 这次是Lean 4自动化数学证明的第三支视频。 主要看看GitHub Copilot在处理分析学经典的「ε-δ」问题(描述函数极限的经典方法)时,效果究竟如何。
5/22/2025 9:08:40 AM

陶哲轩“喂饭级”AI教程来了!只用GitHub Copilot证明函数极限问题

视频新人博主陶哲轩又更新了! 这次是“喂饭级”AI教程——手把手演示如何只用GitHub Copilot证明函数极限问题。 (这更新频率确实o( ̄▽ ̄)d)据陶哲轩介绍,他此前主要将GitHub Copilot用于一些“花里胡哨”的代码补全,但实际情况是,如果想让它来证明数学定理,往往需要人类的“正确指挥”。
5/21/2025 9:10:00 AM

打破56年数学铁律!谷歌AlphaEvolve自我进化实现算法效率狂飙,堪比AlphaGo“神之一手”

数学能力几乎和AlphaGo的围棋水平一样? ! 这是研究员对AlphaEvolve的最新评价,就在不久之前,谷歌DeepMind联合陶哲轩等一众顶尖科学家打造了「通用科学人工智能」AlphaEvolve,直接打破了矩阵乘法领域56年以来的效率基准。
5/19/2025 9:02:00 AM

陶哲轩携AI再战数学!o4-mini秒怂弃赛,Claude 20分钟通关

3天后,陶哲轩YouTube视频二更来了。 上一次,他使用GitHub Copilot(基于GPT-4),成功在33分钟内完成一页非形式化证明。 这次,他尝试了一种更短、更概念化的证明版本,并测试Claude、o4-mini能否基于之前的非形式和形式证明,生成类似的形式化代码。
5/15/2025 8:52:00 AM

陶哲轩油管首秀:33 分钟,AI 速证「人类需要写满一页纸」的证明

第一个产出就很炸裂:人类需要写满一页纸的证明,结果借助 AI 33 分钟就搞定了?!
5/12/2025 3:08:26 PM
清源

陶哲轩油管首秀:33分钟,AI速证「人类需要写满一页纸」的证明

快来围观,陶哲轩当视频博主了。 第一个产出就很炸裂:人类需要写满一页纸的证明,结果借助AI 33分钟就搞定了? 整个过程看起来一气呵成,还是全程“盲证”不用过脑子那种。
5/12/2025 2:26:43 PM

陶哲轩:感谢ChatGPT,4小时独立完成了一个开源项目

这个五一假期,世界顶级数学家是如何度过的? 菲尔兹奖得主陶哲轩,似乎是忙着发布自己的开源项目:「我在大模型的协助下编写了一个概念验证软件工具,用于验证涉及任意正参数的给定估计是否成立(在常数因子范围内)。 」项目地址:,陶哲轩开发了一个用于自动(或半自动)证明分析中估计值的框架。
5/6/2025 3:31:17 PM

陶哲轩亲测点赞o3-mini:专家级证明,我收到了一个完美的答案

刚刚,陶哲轩亲测了一下o3-mini,然后他给出了这样的结论:重建图论中一个标准(专家级)结果的证明,o3-mini是完全可以hold住的。 图片陶哲轩要重建的这个证明,叫做三角形移除引理(triangle removal lemma),由Ruzsa和Szemeredi于1978年提出,是极值图论中的重要结果:对于任意的η>0,都存在c0,使得对于任意一个足够大的有n个顶点的图,如果该图中最多包含cn3个三角形,那么可以通过移除最多ηn2条边,使这个图变为无三角形的图。 用另一种表述方式就是,如果一个有n个顶点的图包含o(n3)个三角形,那么可以通过移除o(n2)条边来删除所有的三角形。
3/11/2025 12:07:10 PM

陶哲轩:通义千问QwQ奥数真厉害,开源大模型顶流

QwQ 具有神奇的推理能力。 一个刚发布两天的开源模型,正在 AI 数学奥林匹克竞赛 AIMO 上创造新纪录。 本周五,知名数学家、加州大学洛杉矶分校教授、菲尔茨奖得主陶哲轩(Terence Tao)介绍了第二届 AIMO 竞赛的最新进展。
11/30/2024 1:48:00 PM
机器之心