AI在线 AI在线

陶哲轩

陶哲轩再爆:一个月三破18年未解难题!AlphaEvolve彻底改写数学研究规则

数学界再次见证奇迹! 一项沉睡了18年的难题,在一个月内竟被AI与人类联手三度突破! 每一次都将我们对可能性的认知推向新高。
6/5/2025 9:06:00 AM

陶哲轩转发!DeepMind开源「AI数学证明标准习题集」

陶哲轩转发,AI搞数学证明的标准习题集来了! DeepMind最新开源形式化数学猜想库——猜想库收录了经典的形式化表述的数学猜想集合,例如,解析数论中的四个朗道问题。 不仅如此,资源库中还提供了各种代码函数,以方便用户对自然语言的数学猜想进行形式化的表述。
6/3/2025 8:15:00 AM

o4-mini暴击六大数学天团,攻破陶哲轩难题!4.5h激战人类阵地失守

八支「数学家天团」和o4-mini-medium同台竞技,谁会最终胜出? 最近,Epoch AI团队举办了一场竞赛,专门考察AI数学能力的进展。 这场比赛邀请了约40位数学精英,分成8组,每组由学科专家和优秀本科生组成。
5/28/2025 10:30:41 AM

陶哲轩联手AI挑战经典ε-δ极限!加法秒杀、乘法翻车

数学大师陶哲轩的AI新实验来了! 这次是Lean 4自动化数学证明的第三支视频。 主要看看GitHub Copilot在处理分析学经典的「ε-δ」问题(描述函数极限的经典方法)时,效果究竟如何。
5/22/2025 9:08:40 AM

陶哲轩“喂饭级”AI教程来了!只用GitHub Copilot证明函数极限问题

视频新人博主陶哲轩又更新了! 这次是“喂饭级”AI教程——手把手演示如何只用GitHub Copilot证明函数极限问题。 (这更新频率确实o( ̄▽ ̄)d)据陶哲轩介绍,他此前主要将GitHub Copilot用于一些“花里胡哨”的代码补全,但实际情况是,如果想让它来证明数学定理,往往需要人类的“正确指挥”。
5/21/2025 9:10:00 AM

打破56年数学铁律!谷歌AlphaEvolve自我进化实现算法效率狂飙,堪比AlphaGo“神之一手”

数学能力几乎和AlphaGo的围棋水平一样? ! 这是研究员对AlphaEvolve的最新评价,就在不久之前,谷歌DeepMind联合陶哲轩等一众顶尖科学家打造了「通用科学人工智能」AlphaEvolve,直接打破了矩阵乘法领域56年以来的效率基准。
5/19/2025 9:02:00 AM

陶哲轩携AI再战数学!o4-mini秒怂弃赛,Claude 20分钟通关

3天后,陶哲轩YouTube视频二更来了。 上一次,他使用GitHub Copilot(基于GPT-4),成功在33分钟内完成一页非形式化证明。 这次,他尝试了一种更短、更概念化的证明版本,并测试Claude、o4-mini能否基于之前的非形式和形式证明,生成类似的形式化代码。
5/15/2025 8:52:00 AM

陶哲轩油管首秀:33 分钟,AI 速证「人类需要写满一页纸」的证明

第一个产出就很炸裂:人类需要写满一页纸的证明,结果借助 AI 33 分钟就搞定了?!
5/12/2025 3:08:26 PM
清源

陶哲轩油管首秀:33分钟,AI速证「人类需要写满一页纸」的证明

快来围观,陶哲轩当视频博主了。 第一个产出就很炸裂:人类需要写满一页纸的证明,结果借助AI 33分钟就搞定了? 整个过程看起来一气呵成,还是全程“盲证”不用过脑子那种。
5/12/2025 2:26:43 PM

陶哲轩:感谢ChatGPT,4小时独立完成了一个开源项目

这个五一假期,世界顶级数学家是如何度过的? 菲尔兹奖得主陶哲轩,似乎是忙着发布自己的开源项目:「我在大模型的协助下编写了一个概念验证软件工具,用于验证涉及任意正参数的给定估计是否成立(在常数因子范围内)。 」项目地址:,陶哲轩开发了一个用于自动(或半自动)证明分析中估计值的框架。
5/6/2025 3:31:17 PM

陶哲轩亲测点赞o3-mini:专家级证明,我收到了一个完美的答案

刚刚,陶哲轩亲测了一下o3-mini,然后他给出了这样的结论:重建图论中一个标准(专家级)结果的证明,o3-mini是完全可以hold住的。 图片陶哲轩要重建的这个证明,叫做三角形移除引理(triangle removal lemma),由Ruzsa和Szemeredi于1978年提出,是极值图论中的重要结果:对于任意的η>0,都存在c0,使得对于任意一个足够大的有n个顶点的图,如果该图中最多包含cn3个三角形,那么可以通过移除最多ηn2条边,使这个图变为无三角形的图。 用另一种表述方式就是,如果一个有n个顶点的图包含o(n3)个三角形,那么可以通过移除o(n2)条边来删除所有的三角形。
3/11/2025 12:07:10 PM

陶哲轩:通义千问QwQ奥数真厉害,开源大模型顶流

QwQ 具有神奇的推理能力。 一个刚发布两天的开源模型,正在 AI 数学奥林匹克竞赛 AIMO 上创造新纪录。 本周五,知名数学家、加州大学洛杉矶分校教授、菲尔茨奖得主陶哲轩(Terence Tao)介绍了第二届 AIMO 竞赛的最新进展。
11/30/2024 1:48:00 PM
机器之心

陶哲轩:计算机通用方法,往往比深奥的纯数学更能解决问题

陶哲轩强调了在数学应用和问题解决中需要找到合适的平衡点:既不过度简化,也不过度复杂化,避免过度优化和过度抽象导致的反效果。  刚刚,著名数学家陶哲轩在个人社交平台更新的几篇帖子,引起大家广泛的共鸣。 陶哲轩用浅显易懂的语言表达了自己对数学的理解与思考心得。
11/15/2024 1:18:00 PM
机器之心

陶哲轩众包数学项目完成度99.99%:仍未看到AI工具的重大贡献

陶哲轩发起的「众包」数学研究项目终于快要迎来胜利时刻!大约在三周前,陶哲轩提出了一个众包项目,结合专业和业余数学家、自动定理证明器、AI 工具和证明辅助语言 Lean, 来描述与 4694 条 magma(原群) 方程定律相关的蕴含图,这些定律可以使用最多四次 magma 操作调用来表达。也即,需要确定这 4694 条定律之间可能蕴含的的真假。
10/13/2024 6:19:00 PM
机器之心

陶哲轩提前实测满血版 OpenAI o1:能当研究生使唤

原来早在 8 月份,陶哲轩就已经用上了 OpenAI o1。还是现在大家都用不上的满血版本(眼泪不争气地从嘴角流出来)。提前批大佬是怎么玩最新天花板的呢?他向 o1 模型提出一个措辞模糊的数学问题,发现它竟然能成功识别出克莱姆定理。而且答案是“完全令人满意的”那种。当然,陶哲轩还做了一些其它测试,测下来总体体验就是:比以前的模型更牛,多堆点提示词表现还不错,但仍然会犯不小的错误,也没有产生啥自己的思想。陶哲轩是这样形容的:这种感觉,就像给一个平庸无奇但又有点小能力的研究生提供建议。不过,这已经比以前的模型有所改进,
9/16/2024 6:51:12 PM
清源

陶哲轩IMO演讲全文:一次性解决一千个问题,AI让数学摆脱蛮力计算

在探索「数学之美」的路上,人工智能到底走到哪一步了?说到这个话题,可能没人比数学家陶哲轩更懂。他几乎是最常用 AI 辅助证明的数学家之一,还在今年的 AI 数学奥林匹克竞赛(AIMO 进步奖)担任了顾问委员。 最近,在 IMO 2024 的一场演讲中,陶哲轩全面回顾和展望了计算机与人工智能在数学研究中应用范式的演变。视频链接:,他从早期计算工具讨论到现代机器学习和形式化证明助手的演变过程,还着重介绍了最近取得的突破和面临的挑战。陶哲轩强调,虽然人工智能在数学领域的作用越来越大,但人类的洞察力和创造力对于在该领域取得
8/29/2024 2:31:00 PM
机器之心

陶哲轩点评谷歌AlphaProof:AI在数学竞赛中展现「超凡智慧」

在奥数问题面前,AI 的「智商」往往不太够用。不过,这已经是过去式了。谷歌 DeepMind 用 AI 做出了今年国际数学奥林匹克竞赛 IMO 的真题,并且距拿金牌仅一步之遥。对于 AI 来说,奥数不再是问题了。IMO 2024 中六个问题的每一个问题满分为 7 分,总分最高 42 分。DeepMind 的系统最终得分为 28 分,意味着解决的 4 个问题都获得了满分 —— 相当于银牌类别的最高分。DeepMind 文章连接: AI 辅助证明的数学家陶哲轩近期正处在出差的忙碌中,对问题求解引擎 AlphaProof
7/28/2024 11:10:00 PM
机器之心

陶哲轩支持!AI数学奥林匹克竞赛进步奖公布,奖金100多万美元

大模型做数学题到底如何,不妨让它参与一下这种级别的比赛。 「AI 数学奥林匹克竞赛(AIMO 进步奖)的初步成绩已公布。根据排行榜的数据,目前看来,获胜的程序在私人测试中正确回答了 29/50 道题,这一成绩比预期的要高。」刚刚,陶哲轩在个人博客中公布了这一消息。AIMO 最初由一家搞机器学习量化交易的非银行金融机构 XTX Markets 发起,主要是让参与者使用 AI 模型解决国际数学难题,而本次进步奖的目标是创建能够解决用 LaTeX 格式编写的复杂数学问题的算法和模型。这将有助于推动人工智能模型的数学推理能
7/4/2024 6:09:00 PM
机器之心