← 返回首页
8 分钟阅读
OpenAI 推翻 Erdős 80 年猜想:AI 首次自主解决数学核心开放问题
LLM底层技术2026-06-02

OpenAI 推翻 Erdős 80 年猜想:AI 首次自主解决数学核心开放问题

📌 核心问题

1946 年,Paul Erdős 提出了一个看似简单却困扰数学界近 80 年的问题:在平面上放置 n 个点,最多能有多少对点恰好相距 1 个单位?这就是著名的「平面单位距离问题」(Planar Unit Distance Problem),被 Brass、Moser 和 Pach 在 2005 年的著作中称为「可能是组合几何中最著名(也最容易解释)的问题」。

几十年来,数学界普遍认为基于「方形网格」的构造已经是最优的——其增长率仅为 n^{1+o(1)},即略快于线性增长。Erdős 本人甚至为此问题设了奖金。2026 年 5 月 20 日,OpenAI 宣布其内部通用推理模型自主推翻了这一长达 80 年的猜想,构造出无穷多个反例,实现了多项式级别的改进。

这是数学史上第一次,一个数学子领域中的核心开放问题被 AI 系统自主解决。Fields 奖得主 Tim Gowers 称这一结果为「AI 数学的里程碑」。

📊 关键数据

  • 问题历史:1946 年由 Erdős 提出,近 80 年未被解决
  • 此前最佳下界:n^{1+C/log(log(n))}(来自方形网格构造),增长率仅略快于线性
  • 新结果:对无穷多个 n,构造出至少 n^{1+δ} 个单位距离对(δ>0 为固定常数)
  • Princeton 数学教授 Will Sawin 后续精化证明,取 δ=0.014
  • 此前最佳上界:O(n^{4/3}),来自 Spencer、Szemerédi 和 Trotter 1984 年的工作
  • 模型:非数学专用系统,而是通用推理模型,通过 test-time compute 搜索证明策略

🏗️ 技术架构与证明设计

  • 从高斯整数出发:Erdős 的原始下界基于高斯整数 Z[i](形如 a+bi 的数),利用其唯一分解性质构造单位距离对
  • 代数数论推广:新证明将高斯整数替换为更复杂的代数数域扩展,这些扩展具有更丰富的对称性,能产生更多单位长度差
  • 无限类域塔与 Golod-Shafarevich 理论:证明使用这些工具来论证所需数域的存在性,这些工具在代数数论中众所周知,但用于欧氏平面几何问题令人意外
  • 通用推理模型发现:证明来自一个非专用数学系统,通过在 Erdős 问题集合上评估,自主产出了这一证明
  • 外部验证:一组独立数学家验证了证明,并撰写了配套论文解释论证细节和结果意义

🔑 关键洞察

🔑 AI 首次自主解决数学核心开放问题

这不同于之前 AI 辅助数学证明的案例(如 Lean 形式化验证)。OpenAI 的模型并非针对单位距离问题训练或搭建,而是一个通用推理系统,在评估 Erdős 问题集合时自主发现了证明。这表明前沿 AI 模型的推理能力已经达到了「原创性洞察」的水平——不仅能辅助人类,还能提出人类未曾想到的思路。

🔑 跨领域知识迁移是关键突破点

证明最令人惊讶之处在于:一个组合几何问题的答案来自代数数论。AI 模型将「无限类域塔」和「Golod-Shafarevich 理论」——这些在代数数论中成熟的工具——带入了欧氏平面几何。正如 Thomas Bloom 所说:「这表明数论构造对这类问题有远超我们预期的解释力,而且所需的数论可以非常深。」跨领域连接正是 AI 相比人类研究者的优势所在。

🔑 Test-time Compute 的研究范式验证

OpenAI 在验证初始证明后,进一步研究了模型在不同 test-time compute 量下的成功率。这表明「推理时扩展计算」(inference-time scaling)不仅能提升模型在标准 benchmark 上的表现,还能在真正的前沿研究问题上发挥作用。这一范式可能改变未来 AI 辅助科研的方式:不是训练专用模型解决特定问题,而是让通用模型在推理时投入更多计算来搜索解决方案。

🔑 人类专家角色从「解题者」变为「诠释者」

配套论文中,外部数学家的工作不是验证对错,而是诠释和丰富结果的意义。Bloom 指出,AI 证明「教会了我们关于这个新问题的新东西」,而 Shankar 认为这证明 AI 模型「超越了人类数学家的助手角色,有能力产生原创的巧妙想法并将其付诸实现」。这预示着一种新的人机协作范式:AI 负责搜索和发现,人类负责理解、诠释和提出新问题。

💭 引发思考

这一结果的意义远超数学本身。如果一个通用推理模型能够保持复杂论证的连贯性、连接遥远知识领域、产出经得起专家审查的工作,那么这种能力同样适用于生物学、物理学、材料科学、工程学和医学。OpenAI 明确表示,这是其「更自动化研究」长期路径的一部分——让系统帮助科学家和工程师探索更多想法、攻克更难的技术问题。

但这也带来了新的挑战。当 AI 开始在研究的创造性环节发挥作用时,「对齐」问题变得更加紧迫——我们如何确保非常智能的系统与人类目标保持一致?OpenAI 自己也承认「这强化了我们对理解 AI 下一发展阶段、对齐挑战以及人机协作未来的紧迫感」。数学因其精确性和可验证性,恰好是研究这些问题的理想试验场。未来几年,我们很可能会看到更多长期未解的数学问题被 AI 攻克,而每一次成功都将深化我们对 AI 推理能力的理解。

📎 相关阅读

  • 原始证明:点击查看
  • 外部数学家配套论文:点击查看
  • 模型推理链摘要:点击查看
  • OpenAI 官方博文:点击查看

逍遥云初 | 2026.06.02

逍遥云初 · 2026-06-02

记录 · 思考 · 成长