陶哲轩用 AI 形式化的说明究竟是什么？一文看懂 PFR 想象的前世今生

正是包括两位菲尔兹奖获得者在内四位数学家的坚持，才得以说明了一个堪称「加性组合学圣杯」的想象，其中 AI 辅助说明起到了不可磨灭的作用。12 月 5 日，著名数学家、菲尔兹奖获得者陶哲轩在社交网络宣布：对多项式 Freiman-Ruzsa 想象（PFR）的说明进行形式化的 Lean4 项目成功完成，并且耗时仅三周时间，其依赖图的全部节点都带上了「可爱的绿色阴影」。Lean 编译器也报告该想象符合标准公理，可以说这是计算机和 AI 辅助说明的一项巨大成功。但多项式 Freiman-Ruzsa 想象究竟是什么？为什么对

正是包括两位菲尔兹奖获得者在内四位数学家的坚持，才得以说明了一个堪称「加性组合学圣杯」的想象，其中 AI 辅助说明起到了不可磨灭的作用。

12 月 5 日，著名数学家、菲尔兹奖获得者陶哲轩在社交网络宣布：对多项式 Freiman-Ruzsa 想象（PFR）的说明进行形式化的 Lean4 项目成功完成，并且耗时仅三周时间，其依赖图的全部节点都带上了「可爱的绿色阴影」。

Lean 编译器也报告该想象符合标准公理，可以说这是计算机和 AI 辅助说明的一项巨大成功。

陶哲轩用 AI 形式化的说明究竟是什么？一文看懂 PFR 想象的前世今生

但多项式 Freiman-Ruzsa 想象究竟是什么？为什么对该想象的说明不仅是一个数学问题，而且对计算机科学也很重要？量子杂志近日报道了这项成就不凡的数学说明及其令人惊叹的形式化工作，并在文中对多项式 Freiman-Ruzsa 想象的提出和说明历程进行了梳理与科普。

总结起来：四位著名数学家（包括两位菲尔兹奖获得者）说明了一个堪称「加性组合学圣杯」的想象。在一个月的时间内，陶哲轩领导的一个松散的合作团队通过计算机辅助说明进行了验证。

下面就进入他们的故事吧。

陶哲轩用 AI 形式化的说明究竟是什么？一文看懂 PFR 想象的前世今生

在一个随机选取的数值聚集中，加法可能会如野火蔓延，势不可挡。

对于这样一个聚集，如果将其中每两个数加起来，就会得到一个新的列表并且其中所含的数值将远远多于一开始的聚集。如果一开始的聚集有 10 个随机数，那么新的列表（称为和集）会有大约 50 个元素。如果一开始是 100 个随机数，那么和集中可能会有大约 5000 个元素；而如果初始有 1000 个数，那么和集会有 50 万个数。

但如果初始聚集有构造，则和集中的数会少得多。假设有另一个蕴涵 10 个数的聚集：这些数都是 2 到 20 之间的偶数。由于不同的一对数可能会得到相同的求和结果（比如 10+12=8+14=6+16），因此和集只会有 19 个数，而非 50 个。当初始聚集变得越来越大时，这一差异也会越来越显著。一个由 1000 个数构成的构造化列表的和集可能仅会有 2000 个数。

1960 年代，数学家 Gregory Freiman 开始研究和集较小的聚集，以探究加法和聚集构造之间的联系 —— 这是定义加性组合学（additive combinatorics）这一数学领域的一个关键联系。Freiman 取得了出色的进展，他说明：一个和集较小的聚集必然被蕴涵在一个更大的聚集内并且这个更大聚集的元素具有高度规则的模式。但自那以后，这一领域就停滞不前了。「Freiman 最初的说明非常难以理解，以至于没人能真正确定它到底是不是正确的。因此它没有产生应有的影响。」法兰西公学院和剑桥大学的数学家 Timothy Gowers 说，他也是一位菲尔兹奖获得者，「但后来 Imre Ruzsa 突然出现了。」

Ruzsa 在 1990 年代通过两篇论文用一套优雅的新论证重新说明了 Freiman 定理。几年之后，一位颇具影响力的匈牙利数学家 Katalin Marton（已于 2019 年去世）探究了一个问题：小的和集能够揭示出原始聚集的构造的哪些方面？她替换了该聚集中出现的元素的类型与数学家应当找寻的构造的类型，并认为这能让数学家提取出更多信息。Marton 的想象与说明系统、编码理沦和密码学存在关联，并且在加性组合学领域具有崇高的地位。

陶哲轩用 AI 形式化的说明究竟是什么？一文看懂 PFR 想象的前世今生

Katalin Marton

她的想象「感觉是我们之前无法理解的最基本的东西之一。」牛津大学数学家 Ben Green 说，「它就是我关心的很多事情的基础。」

Green 与 Gowers、加利福尼亚大学圣迭戈分校的 Freddie Manners 以及加利福尼亚大学洛杉矶分校的一位菲尔兹奖获得者陶哲轩（Terence Tao）组成了一个团队。以色列数学家和博主 Gil Kalai 将其称为 A-team，也即数学家精英团队。他们在 11 月 9 日发布的论文《On a conjecture of Marton》中说明了该想象的一个版本。

陶哲轩用 AI 形式化的说明究竟是什么？一文看懂 PFR 想象的前世今生

论文地址：https://arxiv.org/pdf/2311.05762.pdf

未参与该研究的莱斯大学数学家 Nets Katz 描述说这份说明「简单直接得堪称美丽」，并且「多少算是完全出乎意料」。

然后陶哲轩开始通过 Lean 来形式化该说明。Lean 是一种可帮助数学家验证定理的编程语言。不过几周时间，他就成功完成了。12 月 5 日星期二一早，陶哲轩宣布 Lean 已经完成对该想象的说明，并且没有任何 sorry。sorry 是 Lean 中一个标准陈述，表示计算机无法验证某个特定步骤。这是自 2021 年以来这样的说明工具最亮眼的成就，并成为了数学家编写说明的方式的转折点，也就是开始以计算机能理解的方式编写说明。Gowers 说：如果这些工具变得很容易，能让数学家轻松使用，那么它们就可能替代往往耗时漫长且繁重艰巨的同行评审过程。

这一说明的组分已经酝酿了数十年时间。Gowers 在 2000 年代构想了它的前几步。但还要另外 20 年，Kalai 所称的领域「圣杯」才得以说明。

群

为了理解 Marton 想象，熟悉群（group）的概念会很有帮助。简单来说，群是由聚集和运算构成的数学对象。这里我们假设有整数集（一个蕴涵无限个数的聚集）和加法运算。我们每次将两个整数相加，便会得到另一个整数。加法也服从其它一些群运算规则，比如结合律，也就是可以交换运算的顺序：3 + (5 + 2) = (3 + 5) + 2.

在一个群内，你有时候可以找到满足该群所有性质的较小聚集。举个例子，任意两个偶数相加会得到另一个偶数。偶数本身就是一个群，这让其成为了整数的子群（subgroup）。而奇数却不一样，它并非一个子群。如果你将两个奇数加到一起，则会得到一个偶数 —— 这不在原来的聚集中。但只需让每个偶数都加 1，便能得到所有奇数。像这样的有移位（shift）的子群称为陪集（coset）。陪集并不具备子群的所有性质，但它又能保留子群在许多方面的的构造。举个例子，奇数和偶数一样是均匀分布的。

陶哲轩用 AI 形式化的说明究竟是什么？一文看懂 PFR 想象的前世今生

Timothy Gowers

Marton 想象如果有一个由群元素组成的聚集 A，其和集并不比 A 本身大很多，那么就会存在某个具有一个特殊性质的子群 G。对 G 执行几次移位可以得到一些陪集，而这些陪集组合起来就会蕴涵原始聚集 A。此外，她认为陪集的数量并不会比和集的大小增长更快 —— 她相信这应该是一个多项式关系，而非远远更快的指数级增长。

这个研究方向听起来可能好像就是为了满足好奇心，似乎没什么实际用途。但由于它和一个了解子群的总体构造的简单测试（将聚集中的两个元素加起来会发生什么？）有关，所以对数学家和计算机科学家来说就非常重要了。当计算机科学家想要使得加密消息一次只能被解码一部分时，也会遇到这个设法的广义版本。它也会出现在概率可检验说明（probabilistically checkable proof）中 —— 这种说明形式让计算机科学家可以通过检验少量孤立的信息来执行验证。

对于上述的每种情况，你只需要研究一个构造中的一些点，就能得出与一个更大更高层构造有关的结论；比如只需解码一个长消息中的少量比特或验证一个复杂说明的一小部分。

牛津大学的 Tom Sanders（他以前是 Gowers 的学生，现在是 Gowers 的同事）说：「你要么可以假设一切都是一个群的一个大子集，要么可以从许多附加巧合的存在中得到你想要的一切。这两种观点都很有用。」

Ruzsa 在 1999 年发表了 Marton 想象，并充分说明了她的贡献和成就。「她独立于我和 Freiman 得出了这个想象，而且可能先于我们。」他说，「也因此，在我和她交谈过之后，我决定用她的名字来命名这个想象。」尽管如此，数学家现在还是将其称为多项式 Freiman-Ruzsa 想象，简称 PFR。

零和一

和许多数学对象一样，群也有很多不同的形式。Marton 猜测她的想象对所有群都成立。这一点还有待说明。这篇新论文说明其对某一特定类型的群成立，这类群的元素是 (0, 1, 1, 1, 0) 这样的二进制数列表。由于计算机的工作过程就基于二进制，因此这个群对计算机科学至关重要。但它也对加性组合学很有用。「它就像是一个玩具设置，你可以在其中玩耍，尝试各种东西。」Sanders 说，「这里的代数操作起来比非负整数（whole number）容易太多了。」

陶哲轩用 AI 形式化的说明究竟是什么？一文看懂 PFR 想象的前世今生

陶哲轩

这些列表的长度是固定的，而且每一位都要么为 0，要么为 1。这样的两个列表相加就是将一个列表的每一项与另一列表的对应项相加，规则包括 1 + 1 = 0。那么 (0, 1, 1, 1, 0) + (1, 1, 1, 1, 1) = (1, 0, 0, 0, 1)。PFR 试图搞清楚：如果一个聚集算不上是子群，但具有某些类似群的特征，那么这个聚集看起来会是什么样。

为了更清楚地说明 PFR，请想象一下你有一个二元列表构成的聚集 A。现在从 A 中取出每一对元素并相加。所得到的和可构成 A 的和集，记为 A+A。如果 A 中的元素是随机选取的，那么大部分的和都彼此不同。如果 A 有 k 个元素，那就意味着和集有 k²/2 个元素。当 k 很大时（比如 1000），k²/2 就会比 k 大很多。但如果 A 是一个子群，那么 A+A 的每个元素都在 A 中，这就意味着 A+A 的大小和 A 本身是一样的。

PFR 考虑的聚集不是随机的，但也不是子群。在这些聚集中，A+A 的元素数量会有些小，比如 1 万或 10 万。加利福尼亚大学圣迭戈分校的计算机科学家 Shachar Lovett 说：「当你的构造概念比仅仅作为精确的代数构造丰富得多时，这真的会很有用。」

就数学家所知，所有服从这一性质的聚集「都相当接近于真正的子群。」陶哲轩说，「这是一个直觉认识，也就是没有其它类型的假群存在。」Freiman 在其原研究成果中说明了这一命题的一个版本。1999 年时，Ruzsa 将 Freiman 定理从整数扩展到了二元列表设置。他说明，当 A+A 的元素数量是 A 的大小的常数倍时，A 必定被蕴涵在一个子群内。

但 Ruzsa 定理需要子群非常巨大才行。Marton 的见解是假定 A 不是蕴涵在一个巨大的子群中，而是可以蕴涵在一个子群的多项式数量的陪集中并且这个子集不大于原始聚集 A。

好设法看一眼就知道

千年之交那段时间，Gowers 在研究与蕴涵均匀相间的字符串的聚集相关的另一问题时看到了 Ruzsa 对 Freiman 定理的说明。「我就需要这样的东西，差不多就是从有关一个特定聚集的松散得多的信息中获取构造化信息。」Gowers 说，「我非常幸运，就在那不久前，Ruzsa 刚给出这个美不胜收的说明。」

陶哲轩用 AI 形式化的说明究竟是什么？一文看懂 PFR 想象的前世今生

Freddie Manners

Gowers 开始着手尝试说明该想象的多项式版本。他的设法是先从和集相对较小的聚集 A 开始，然后逐渐操作 A，将其变成一个子群。如果他能说明所得子群与原始聚集 A 相似，他就可以轻松断定这个想象是正确的。Gowers 将这个设法分享给了自己的同事，但没人能将其转化成完整的说明。尽管 Gowers 的策略能成功处理一些情况，但在其它情况中，这种操作却会让 A 更加远离多项式 Freiman-Ruzsa 想象的预期结论。

最终，该领域放弃了这一思路。2012 年，Sanders 几乎说明了 PFR。但他需要的移位子群的数量高于多项式水平，尽管只高一点点。Gowers 说，「一旦他做到了，就意味着这事件变得不那么紧迫了，但这仍然是一个我非常喜欢的好问题。」

但 Gowers 的设法依然留存在他同事的记忆和硬盘中。「那是一个真正的好设法。」Green 说，他也曾是 Gowers 的学生，「好设法看一眼就知道。」今年夏季，Green、Manners 和陶哲轩终于将 Gowers 的设法从炼狱中解放了出来。

在决定研究已有 20 年历史的 Gowers 设法之前，Green、陶哲轩和 Manners 的合作成果已经可以罗列 37 页之长。在 6 月 23 日的论文《Sumsets and entropy revisited》中，他们成功使用了概率论中的「随机变量」概念来探测具有小和集的聚集的构造。通过这种切换，该团队可以更巧妙地操作聚集。「处理随机变量在某种程度上比处理聚集要简单得多。」Manners 说，「对于随机变量，我可以稍微调整其中一个概率，而这就可能会给我一个更好的随机变量。」

从这个概率角度入手，Green、Manners 和陶哲轩可以不用再面对一个聚集的元素数量，而是可以去衡量一个随机变量中所蕴涵的信息，这个量被称为熵（entropy）。对加性组合学来说，熵并不是新东西。事实上，陶哲轩在 2000 年代末就尝试过推广这一概念。但还没有人试过将其用于多项式 Freiman-Ruzsa 想象。Green、Manners 和陶哲轩发现它很强。但他们仍然不能说明该想象。

陶哲轩用 AI 形式化的说明究竟是什么？一文看懂 PFR 想象的前世今生

Ben Green

当这个研究团队仔细研究他们的新成果时，他们意识到终于建立了一个可让 Gowers 那蛰伏的设法重获新生的环境。如果使用聚集的熵来衡量聚集的大小，而不是元素数量，则其技术细节可能会好处理得多。「某一时刻我们意识到，比起我们当时正在尝试的思路，这些来自 Tim 的 20 年前的旧设法实际上更可能有效。」陶哲轩说，「于是我们把 Tim 带回了这个项目。然后所有的碎片都出人意料地很好地拼合在了一起。」

尽管如此，在给出完整的说明前，还有很多细节要处理。「我们四个人都还各自忙着其它事，这是有点愚蠢的。」Manners 说，「你希望发表这个伟大的结果并且告诉全世界，但你实际上还依然必须要去写期中报告。」最终，这个团队坚持了下来，并于 11 月 9 日发表了论文。他们说明，如果 A+A 不大于 A 的大小的 k 倍，那么可通过一个不大于 A 的子群的不超过 k¹² 移位而将 A 覆盖其中。这个移位的数量很可能非常大。但这是一个多项式，不会随 k 的增大而指数级增长；而如果 k 在指数中就会这样。

几天之后，陶哲轩开始形式化该说明。他以协作的方式运行了这个形式化项目，使用了版本控制软件包 GitHub 来协调来自全球 25 个志愿者的贡献。他们使用了一种名为 Blueprint 的工具。这个工具是巴黎萨克雷大学数学家 Patrick Massot 开发的，可用于协调组织将陶哲轩所说的「数学式英语」翻译成计算机代码的工作。Blueprint 的功能有很多，其中之一是创建一张图表来描述说明中涉及的各种逻辑步骤。一旦图中所有气泡都变成陶哲轩所说的「可爱的绿色阴影」，这个团队就算完工了。

陶哲轩用 AI 形式化的说明究竟是什么？一文看懂 PFR 想象的前世今生

对 PFR 想象的说明的依赖图，其中方框是定义，椭圆是定理和引理，全部背景都是绿色说明该说明已经完全形式化

他们发现论文中存在一些非常小的拼写错误 —— 在一条网络消息中，陶哲轩指出：「这个项目中与数学最相关的部分的形式化是相对简单直接的，但技术上『显而易见』的步骤反而耗时最长。」

Marton 在她的著名想象得到说明的几年前去世了，但这个说明帮助彰显了她在熵和信息论领域的毕生成就。「当使用这个熵框架进行研究，而不是我之前尝试的框架时，一切都好了很多。」Gowers 说，「对我来说，这依然有些神奇。」

原文链接：https://www.quantamagazine.org/a-team-of-math-proves-a-critical-link-between-addition-and-sets-20231206/

{{userData.name}}已认证

陶哲轩用 AI 形式化的说明究竟是什么？一文看懂 PFR 想象的前世今生

GPU上运行速度比现有模型快3-7倍，IU团队应用全卷积神经网络从事准确的重新肽测序

就像Word中的文本主动改正一样，大谈话模型主动改正化学工艺流程图

微软开源 bitnet.cpp 1-bit LLM 推理框架：不靠 GPU 可本地运行千亿参数 AI 模型，能耗最多降低 82.2%

Meta 用 AI 生成北极光图片，遭网友怒喷

秒变Midjourney高手！精选 52 条高级感的 sref 风格代码

中国电信自研 AI 节能系统：年均节电 8 亿度，节约电费 5.2 亿元

英伟达 CEO 黄仁勋展望公司未来：坐拥 5 万名员工、部署 1 亿个 AI 助手

特斯拉人形机器人 Optimus 现场做饮料，员工证实有人在远程控制

成功率提升15%，浙大、碳硅智慧用LLM进行多属性分子优化，登Nature子刊

研究：AI 医疗建议存巨大安全隐患，22% 的回答可能致死