谷歌DeepMind AI攻克9项数学难题，超越OpenAI

谷歌DeepMind的AlphaProof Nexus，一个专门用于生成机器验证数学证明的AI系统，近期成功解决了九个悬而未决的埃尔德什（Erdős）难题。其中，有两项难题甚至困扰了数学界长达56年，这标志着AI驱动数学发现领域的重大突破。

此次突破紧随OpenAI最近宣布其AI推翻一个80年历史的埃尔德什猜想之后。然而，谷歌DeepMind的AlphaProof Nexus系统更进一步，解决了组合数学和图论领域的九个问题，展现了更广泛的能力范围。

AlphaProof Nexus系统的工作原理是将大型语言模型（LLM）与形式化验证工具Lean相结合。Lean是一个强大的交互式定理证明器和证明助手。这种组合使AI能够自主生成并严格验证数学证明。每个问题的解决成本大约为数百美元。除了埃尔德什难题，该AI还证明了来自在线整数序列百科全书（Online Encyclopedia of Integer Sequences）的44个开放猜想。

值得注意的是，一个更简单的AlphaProof Nexus代理版本也取得了类似的结果，但计算成本更高。研究人员指出，需要全新数学构造的问题目前仍超出该系统的能力范围。

谷歌DeepMind在解决长期数学难题方面的迅速进展，突显了AI在生成原创解决方案方面正在加速发展。该系统能够生成证明、在Lean中验证它们，并重复迭代直到通过形式化验证，这一方法具有颠覆性意义。预计这种方法将显著帮助研究人员以机器的速度进行新颖发现，从而从根本上改变数学研究的格局。

谷歌DeepMind AI攻克9项数学难题，超越OpenAI

推荐阅读

Claude代码“规划模式”：效率与质量的深度解析

Claude Code Zsh包装器：避坑指南与开发决策

Claude Code：规范驱动开发，告别AI编程“三小时魔咒”