⚡ News

谷歌DeepMind AI攻克9项数学难题,超越OpenAI

谷歌DeepMind AI攻克9项数学难题,超越OpenAI

谷歌DeepMind的AlphaProof Nexus,一个专门用于生成机器验证数学证明的AI系统,近期成功解决了九个悬而未决的埃尔德什(Erdős)难题。其中,有两项难题甚至困扰了数学界长达56年,这标志着AI驱动数学发现领域的重大突破。

此次突破紧随OpenAI最近宣布其AI推翻一个80年历史的埃尔德什猜想之后。然而,谷歌DeepMind的AlphaProof Nexus系统更进一步,解决了组合数学和图论领域的九个问题,展现了更广泛的能力范围。

AlphaProof Nexus系统的工作原理是将大型语言模型(LLM)与形式化验证工具Lean相结合。Lean是一个强大的交互式定理证明器和证明助手。这种组合使AI能够自主生成并严格验证数学证明。每个问题的解决成本大约为数百美元。除了埃尔德什难题,该AI还证明了来自在线整数序列百科全书(Online Encyclopedia of Integer Sequences)的44个开放猜想。

值得注意的是,一个更简单的AlphaProof Nexus代理版本也取得了类似的结果,但计算成本更高。研究人员指出,需要全新数学构造的问题目前仍超出该系统的能力范围。

谷歌DeepMind在解决长期数学难题方面的迅速进展,突显了AI在生成原创解决方案方面正在加速发展。该系统能够生成证明、在Lean中验证它们,并重复迭代直到通过形式化验证,这一方法具有颠覆性意义。预计这种方法将显著帮助研究人员以机器的速度进行新颖发现,从而从根本上改变数学研究的格局。

↗ 阅读原文