OpenAI模型推翻离散几何核心猜想
An OpenAI model has disproved a central conjecture in discrete geometry
数学家自1946年埃尔德什提出平面单位距离问题以来,普遍认为方形网格构造在最大化单位距离对数方面基本最优。一个OpenAI内部推理模型推翻了这一猜想,构造了无穷多个n点配置,其中单位距离对数至少为n^{1+δ}(δ>0),普林斯顿大学Will Sawin改进后δ可取0.014。该证明由外部数学家验证并撰写配套论文,其关键要素来自代数数论中的无限类域塔和Golod–Shafarevich理论。菲尔兹奖得主蒂莫西·高尔斯称此为“AI数学的里程碑”。
近80年来,数学家们一直在研究一个看似简单的问题:如果在平面上放置$n$个点,有多少对点之间的距离恰好为$1$?
这就是平面单位距离问题,由保罗·埃尔德什于1946年首次提出。它是组合几何中最著名的问题之一,易于陈述却极难解决。Brass、Moser和Pach在2005年出版的《离散几何研究问题》一书中称其为“可能是组合几何中最著名(也最容易解释)的问题”。普林斯顿大学著名组合学家诺加·阿隆将其描述为“埃尔德什最喜爱的问题之一”。埃尔德什甚至为这个问题设立了奖金。
今天,我们分享单位距离问题的一个突破。自埃尔德什的原创工作以来,普遍认为下文描述的“方形网格”构造在最大化单位距离对数方面基本是最优的。一个OpenAI内部模型推翻了这一长期存在的猜想,提供了一个无限族例子,实现了多项式改进。该证明已由一组外部数学家验证。他们还撰写了一篇配套论文,解释论证过程,并提供该结果重要性的进一步背景和上下文。
这一结果的发现方式也值得关注。该证明来自一个新的通用推理模型,而非专门为数学训练、通过搜索证明策略构建、或针对单位距离问题设计的系统。作为测试高级模型能否为前沿研究做出贡献的更广泛努力的一部分,我们在一个埃尔德什问题集合上对其进行了评估。在这种情况下,它生成了一个解决开放问题的证明。
这一证明对数学界和AI界都是一个重要里程碑。它标志着AI首次自主解决了一个在数学子领域中占据核心地位的著名开放问题。它也展示了这些系统现在所支持的推理深度。数学为推理提供了一个特别清晰的试验场:问题精确,潜在证明可被验证,而一个长论证只有在推理从头到尾保持一致时才成立。解决问题的方法也值得注意。该证明将来自代数数论的意外而精妙的思想引入了一个基础几何问题。
菲尔兹奖得主蒂莫西·高尔斯在配套论文中称这一结果为“AI数学的一个里程碑”。著名数论学家阿鲁尔·尚卡尔表示:“在我看来,这篇论文表明当前的AI模型已超越人类数学家的助手角色——它们能够产生独创的巧妙想法,并将其付诸实现。”
数学家们对该结果的评价
1 of 4
之前已知的从重缩放方形网格构造出大量单位距离的方法。
单位距离问题
设$u \left( n \right)$为平面上$n$个点中单位距离对的最大可能数量。实现线性增长率的例子很容易构造:将$n$个点放在一条直线上得到$n - 1$对,而方形网格给出约$2n$对。之前已知的最佳构造来自重缩放方形网格,结果甚至更多:对于常数$C$,达到$n^{1 + C / \log \log \left( n \right)}$。由于$\log \log \left( n \right)$随$n$趋于无穷,指数中的附加项趋于$0$,意味着这些构造仅实现略快于线性的增长。几十年来,人们普遍认为这个速率基本是最优的,没有构造能显著优于方形网格。用技术术语来说,埃尔德什猜想上界为$n^{1 + o \left( 1 \right)}$,其中附加的$o \left( 1 \right)$表示一个随$n$趋于$0$的项。 我们的新结果推翻了这一猜想。更精确地说,对于无穷多个$n$值,该证明构造了$n$个点的配置,其中至少包含$n^{1 + \delta}$个单位距离对,其中$\delta > 0$是某个固定指数。(最初的AI证明未给出显式的$\delta$,但普林斯顿大学数学教授Will Sawin即将发表的改进表明可以取$\delta = 0.014$。) 该问题的历史有助于理解为何这一结果令人惊讶。自埃尔德什1946年的原始构造以来,已知的最佳下界基本未变。最佳上界$O \left( n^{4 / 3} \right)$可追溯到Spencer、Szemerédi和Trotter在1984年的工作,尽管后来Székely、Katz和Silier、Pach、Raz和Solymosi等人进行了改进和相关结构研究,上界基本保持不变。作为支持猜想的证据,Matoušek和Alon-Bucić-Sauermann研究了平面中非欧几里得距离的问题,并证明“大多数”这类非欧几里得距离在某种意义上服从该猜想。 令人惊讶的是,该构造的关键要素来自一个非常不同的数学分支——代数数论,它研究诸如在称为代数数域的整数扩展中的因式分解等概念。
在验证了初始证明后,我们研究了模型在该问题上随测试时计算量变化的成功率。结果如图所示。
来自代数数论的新技术
在高层次上,该证明从一个熟悉的几何思想出发,并将其推向一个意想不到的方向。
埃尔德什的原始下界可以通过高斯整数来理解:形如$a + b i$的数,其中$a$和$b$是整数,$i$是$-1$的平方根。高斯整数扩展了普通整数,并像它们一样具有诸如唯一质因数分解等性质。普通整数或有理数的这种扩展被称为代数数域。新的论证用来自代数数论的更复杂推广替换了高斯整数,这些推广具有更丰富的对称性,可以产生更多单位长度差。
精确论证使用了诸如无限类域塔和Golod–Shafarevich理论等工具,以证明论证所需的数域确实存在。这些思想对代数数论学家来说众所周知,但令人大为惊讶的是,这些概念对欧几里得平面中的几何问题有影响。
这对数学意味着什么
这一结果标志着AI与数学互动的一个重要时刻:一个AI系统自主解决了一个活跃领域中心长期存在的开放问题。它也提供了AI与人类数学家之间新型合作的早期一瞥。在这种情况下,外部数学家的配套工作描绘了比原始解决方案本身丰富得多的图景。
正如Thomas Bloom在配套笔记中所写:
“在评估AI生成的证明的重要性和影响力时,我问自己的一个问题是:它是否教会了我们关于这个问题的新东西?我们现在是否更好地理解了离散几何?我认为答案是适度的肯定:这表明数论构造对这些问题的贡献比我们之前猜测的要大得多;而且,所需的数论可以非常深奥。毫无疑问,许多代数数论学家将在未来几个月里仔细研究离散几何中的其他开放问题。”
该解决方案揭示的代数数论与离散几何之间的意外联系,是这一结果引人注目的部分原因。它不仅解决了一个具体的猜想,还可能为数学家提供一座桥梁,以开始探索进一步的相关问题。
Bloom还指出了更广泛的可能性:
“知识的边界非常参差不齐,毫无疑问,未来几个月和几年将在数学的许多其他领域看到类似的成功,AI通过揭示意外联系并将现有技术机器推向极限,解决了长期存在的开放问题。AI正在帮助我们更充分地探索我们几个世纪以来建造的数学大教堂;还有哪些看不见的奇迹在等待?”
这一结果提供了一个有希望的范例:AI不仅贡献了一个解决方案,还贡献了一项数学发现,其重要性通过后续的人类理解变得更加清晰和丰富。
为何这很重要
其意义远大于这一特定结果。更好的数学推理可以使AI成为更强的研究伙伴:能够整合困难的思路,连接跨知识领域的想法,揭示专家可能未优先考虑的有前途的路径,并帮助研究人员在原本过于复杂或耗时的问题上取得进展。
这些能力在数学之外也很重要。如果一个模型能保持复杂论证的一致性,连接跨知识领域的想法,并产生经得起专家审查的工作,那么这些在生物学、物理学、材料科学、工程和医学中也是有用的能力,并且它们是我们通向更自动化研究的长期路径的一部分:能够帮助科学家和工程师探索更多想法并追求更困难技术问题的系统。
AI即将在研究中的创造性部分扮演非常严肃的角色,最重要的是在AI研究本身。虽然这一进展并不意外,但它强化了我们感受到的紧迫性:理解AI发展的下一阶段、对齐非常智能系统的挑战,以及人机协作的未来。
那个未来仍然依赖于人类的判断。专业知识变得更有价值,而非更少。AI可以帮助搜索、建议和验证。人们选择重要的问题,解释结果,并决定接下来要追求什么问题。