数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

科学研究，尤其是数学研究，真的要被AI彻底改变了。两位数学研究人员，利用GPT-5，只用一个周末就解决了10个「百年悬案」级的埃尔德什难题。埃尔德什难题，又名为Erdös problems，是数学家埃尔德什生前留下的大约1000多个问题，此前人类只解决了部分。

科学研究，尤其是数学研究，真的要被AI彻底改变了。

两位数学研究人员，利用GPT-5，只用一个周末就解决了10个「百年悬案」级的埃尔德什难题。

埃尔德什难题，又名为Erdös problems，是数学家埃尔德什生前留下的大约1000多个问题，此前人类只解决了部分。

上一周，前微软副总裁，现OpenAI研究科学家Sebastien Bubeck第一次确认了这件事。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

今天，其中的一名的研究人员Mark Sellke最终确认了细节。

他们「问了」GPT-5数千次，就找到了10个未解决的埃尔德什难题的求解方案。

并且GPT-5还在另外11个问题上，发现了显著进展。

这种通过AI查询搜索的研究范式可能彻底改变科学、数学等基础学科的研究方法。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

AI已经是数学家的大杀器，如果不用可能就面临出局了。

其中，Bubeck特地提到GPT-5 Pro在文献搜索方面的能力非常强大。

比如在问题339上，GPT-5 Pro经过搜索确认，其实有其他数学家20年前就解决了。

这种深层的文献搜索能力，目前只有AI能够做到。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

就连陶哲轩也表示，AI正在改变数学研究。

陶哲轩：「中等能力」的AI是关键

就在最近，陶哲轩连发数条推文表示：

未来AI在数学上的最有成效应用，并不会来自最强大的模型去解最难的问题，而是来自「中等能力」的AI去处理那些琐碎、耗时、但又不可或缺的研究环节。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

比如帮数学家查文献、整理笔记、验证引用、归档资料——这些看起来「没技术含量」的工作，恰恰是最适合AI的。

他用来说明和论证这个观点的例子正是开头所描述的埃尔德什难题。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

在一个叫Erdős Problems的网站上，收录着上千个以数学家保罗·埃尔德什命名的命题。

其中大约600个被标注为「未解决」。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

就在几天前，几位数学志愿者尝试了一个新方法——用AI深度检索工具重新搜索资料，解决Erdős Problems上的数学难题。

AI帮他们扫出一批疑似「已有解」的线索，人工再复核、比对、阅读。

短短几天，6个原本被列为「未解决」的问题被重新标记为「solved」：Problem 339、Problem 494、Problem 621、Problem 822、Problem 903、Problem 1043。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

随即，评论区热闹了起来。

有人惊讶：原来这些题早被解决，只是没人找到；也有人开始主动使用同样的工具，继续筛查更多问题。

数学界第一次感受到：AI不一定帮你「解出」什么，但能帮你「发现」被遗忘的答案。

陶哲轩在帖文中评价这一趋势：

AI工具输出不会直接进入网站，而是由人工复核后更新。但过去几天评论区明显活跃了，出现了更多带文献链接的注释，说明很多发现确实是AI辅助完成的。

陶哲轩本人在Github上也维护了一个Erdős Problems埃尔德什问题数据库。

截止发稿前2个小时，陶哲轩才刚刚更新了数据库。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

这些问题中有些还有悬赏金。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

比如悬赏10000美元的数论题。

这道题目已经2001年被Baker，Harman和Pintz解决。

然后在2025年9月28日正式确认，大概率就是在AI的帮助下找到的。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

其他埃尔德什难题速览

比如上面提到的问题339，GPT-5 Pro直接从浩如烟海的论文里找到了「答案」。

就是2003年发布的一篇论文。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

问题621是一道图论。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

问题822为数论。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

问题903是组合数学。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

其他未解决的问题，有些还有悬赏金额。

如果你稍微懂点数学，也可以用GPT-5试着搜索一下。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

以上这些难题，绝大部分问题可能已经在浩如烟海的论文中被前人解决了。

但在AI出现前，想通过人力来查遍所有论文是不现实的。

从查文献开始，AI正悄悄重塑数学研究

在数学研究里，查文献一直是最让人头疼的环节之一。

如果问题有清晰的名字、固定的研究圈子，那还好。随便搜一篇关键论文，顺着引用链往前往后查，就能很快摸清全貌。

可很多问题压根没有标准名称。

有的埋在几十年前的期刊里，有的藏在不同学派、不同语言的论文中，还有的被研究者「顺带提了一嘴」，但没出现在标题里。

陶哲轩说，这时候用传统方法，就像在大海捞针。

哪怕你是专家，也得一篇篇点开、反复确认。有时花几天功夫，才发现看错了方向。

AI则能跨语义、跨领域地扫描大规模文献，用自然语言理解去捕捉相似概念。

比如输入一个模糊的研究方向，AI就能自动联想到各种近义的表达、不同领域的说法，从而找到那些人类肉眼容易忽略的论文。

当然，陶哲轩也提醒：AI查文献并不需要「完美命中」。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

但只要在同样的时间里，能找到更多有用的线索、减少无效命中，它就已经赢了。

而且学者在学会使用之后，投入的时间成本会被多次使用「平摊」，越用越值。

在他看来，这种模式的意义不止是提效。它其实在重构科研的节奏：

AI的成功率不必是100%，它只要比传统方法更高，就能带来真正的生产力提升。

在传统科研里，当研究者查遍资料、却一无所获时，这个过程通常不会写进论文。

毕竟，没人会在结论里说「我什么都没找到」。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

一方面是担心被误会成「没查仔细」；另一方面，是因为学术写作习惯于只报告「成功」的结果。

但这样一来，同一个「无结果」的搜索，可能会被不同的人重复几十遍。

陶哲轩在帖子最后写道：AI的系统化搜索，可能改变这种状况。

因为当机器以同样的标准批量检索上百个问题时，「没查到」也变成了可量化的数据。

例如，可以公开地写：在36个问题中， 24个找到了额外文献， 12个没有。这样的结果更透明，也能更准确反映已有文献的分布。

AI不仅帮人找到答案，也让「没有答案」成为有价值的发现。

它让科研流程第一次具备了信息闭环：正向结果指向进步，反向结果避免浪费。

这或许才是AI带来的真正文化变革，它让科学回到它最朴素的样子——诚实地呈现事实，不论好坏。

陶哲轩这一连串思考，看似在谈AI，其实是在谈「人类如何重新组织知识」。

AI不会创造真理，而是在于让人类更快地接近真理。

它让重复劳动变得可控，让查不到结果也能成为信息；它不是研究者的竞争者，而是科研世界里第一个真正的时间节省器。

它让数学家不再被搜索、整理、验证这些繁琐工作拖住，而是能把注意力重新放回那件最重要的事——思考。

或许未来我们回望这一刻，会发现：人工智能没有改变数学的本质，它只是让数学回到了它该有的速度。

数学界地震！GPT-5连破10道「百年悬案」，陶哲轩：AI革命才刚开始

陶哲轩：「中等能力」的AI是关键

相关资讯

数学真理的极限在哪里？希尔伯特第十问题扩展版得到证明

大模型全军覆没，中科院自动化所推出多图数学推理新基准 | CVPR 2025

思维链也会「跳帧」？浙大团队提出CoT-Bridge，显著提升数学推理性能