News

菲尔兹奖得主:ChatGPT 5.5 Pro两小时完成博士级数学研究

菲尔兹奖得主:ChatGPT 5.5 Pro两小时完成博士级数学研究

英国数学家蒂莫西·高尔斯(Timothy Gowers),一位著名的菲尔兹奖得主,最近在其博客中披露了一项惊人的成就:ChatGPT 5.5 Pro在无需任何人工干预的情况下,于短短两小时内完成了一项博士级别的数论数学研究。高尔斯教授明确指出,他本人对这项研究的贡献为零,甚至没有使用任何特别巧妙的提示词。

高尔斯教授,同时也是法兰西学院组合学讲席教授和剑桥大学三一学院院士,向ChatGPT 5.5 Pro输入了数论学家梅尔·纳坦森(Mel Nathanson)论文中的一些开放性问题。这些问题主要探讨了整数和集中某些集合的可能大小,以及如何高效地构建具有特定属性的集合。

ChatGPT 5.5 Pro 仅用17分钟破解一个开放性数学难题

纳坦森曾为其中一个问题证明了一个指数级别的界限,并提出是否有可能进一步改进。高尔斯教授表示,ChatGPT 5.5 Pro在经过17分5秒的“思考”后,给出了一个最佳的二次界限结构。其核心思想在于:模型将纳坦森证明中的一个组件替换为组合学中众所周知但此前并未应用于此特定问题的更高效变体。

随后,当被要求时,ChatGPT 5.5 Pro又在2分23秒内将论证重写为LaTeX预印本。高尔斯教授核查了其正确性,并让模型解决了一个相关的变体问题,模型也轻松应对。这两项成果均已作为预印本公开。

推广版本问题:从指数到多项式的飞跃

一个更普遍的问题被证明难度更大。此前,麻省理工学院学生伊萨克·拉贾戈帕尔(Isaac Rajagopal)曾对此问题进行过研究,并证明了一个指数依赖关系。高尔斯教授向ChatGPT 5.5 Pro提供了拉贾戈帕尔的论文,并要求其尝试改进。

接下来的过程是逐步升级:在16分41秒后,模型给出了第一个改进。拉贾戈帕尔判断这一改进是正确的,但认为这是对他自己工作的常规修改。高尔斯教授随后“贪婪地”要求ChatGPT尝试一个更强的界限。

又经过13分33秒,模型报告了乐观的结果,但表示仍需检查两个技术声明。9分12秒后,检查完成。最终的预印本在31分40秒内准备就绪。模型成功将界限从指数级别改进为多项式级别。

高尔斯教授引述拉贾戈帕尔的评估称,这些结果“几乎肯定是正确的”,无论是从单个证明步骤还是从底层思想来看。拉贾戈帕尔也表示,虽然第一个改进是“常规修改”,但将界限改进到多项式级别则“相当令人印象深刻”。他将模型的关键思想描述为“相当巧妙”,因为它找到了一种反直觉的方法。

↗ 阅读原文