News

AI正步入“自我进化”时代:机器赋能自身迭代的探索与挑战

AI正步入“自我进化”时代:机器赋能自身迭代的探索与挑战

机器终有一天会自我改进的设想,自1966年英国数学家I. J. Good提出可能导致“智能爆炸”以来,递归式自我改进(RSI)一直是AI研究中既令人向往又令人担忧的话题。如今,人工智能的最新进展正在引发人们深思,这一过程的部分环节是否已然启动。

RSI的定义众说纷纭。有人将其视为引发监管的“稻草人”,有人则将其用于市场营销;有人认为它意味着完全自主的循环,另一些人则认为任何利用技术构建技术的行为都可归入此类。最稳妥的说法是,它是一个光谱。从最严格的意义上讲,研究人员用此术语描述那些不仅能改进其输出,还能改进其改进过程——即在无人为干预下生成想法、评估结果并修改自身方法的系统。按此标准,当前许多系统仍未达标。它们能帮助构建更优秀的AI,但仍需人类设定目标、定义成功并决定保留哪些变更。因此,问题不在于某种形式的自我改进今天是否存在,而在于这个循环实际闭合了多少。

数十年来,研究人员一直在为RSI的实现奠定基石。机器学习(ML)算法能自动调整程序的参数,使程序能够玩游戏甚至创建新程序。名为进化算法的ML方法则能多样化并迭代设计解决方案,包括其他算法。在过去十年中,“AutoML”已自动化了机器学习模型(如神经网络)的构建、训练和评估等流程。

今天,GPT、Gemini、Claude和Grok等大型语言模型(LLM)进一步拓展了这一趋势。它们最大的用例之一是编写代码,包括用于生成自身未来版本的代码。OpenAI在二月份报告称,GPT-5.3-Codex在其自我创建过程中发挥了关键作用,帮助调试训练、管理部署并分析评估结果。Anthropic则宣称,其大部分代码现在由Claude Code编写。然而,这些系统仍依赖人类的指导和验证来完成工作。

去年,Google DeepMind发布了名为AlphaEvolve的系统,一个“用于科学和算法发现的编码代理”。它利用LLM来指导解决方案的演进,例如优化神经网络架构、数据中心调度和芯片设计。这并非一个完全递归的循环,因为人们仍需决定AlphaEvolve应解决什么问题以及如何评估其性能。但每一次突破都增强了科学家实现进一步AI突破的能力。Google DeepMind的计算机科学家Matej Balog表示,这“也是人类与机器之间一个非常协作的过程”。

↗ 阅读原文