AI正步入“自我进化”时代：机器赋能自身迭代的探索与挑战

机器终有一天会自我改进的设想，自1966年英国数学家I. J. Good提出可能导致“智能爆炸”以来，递归式自我改进（RSI）一直是AI研究中既令人向往又令人担忧的话题。如今，人工智能的最新进展正在引发人们深思，这一过程的部分环节是否已然启动。

RSI的定义众说纷纭。有人将其视为引发监管的“稻草人”，有人则将其用于市场营销；有人认为它意味着完全自主的循环，另一些人则认为任何利用技术构建技术的行为都可归入此类。最稳妥的说法是，它是一个光谱。从最严格的意义上讲，研究人员用此术语描述那些不仅能改进其输出，还能改进其改进过程——即在无人为干预下生成想法、评估结果并修改自身方法的系统。按此标准，当前许多系统仍未达标。它们能帮助构建更优秀的AI，但仍需人类设定目标、定义成功并决定保留哪些变更。因此，问题不在于某种形式的自我改进今天是否存在，而在于这个循环实际闭合了多少。

数十年来，研究人员一直在为RSI的实现奠定基石。机器学习（ML）算法能自动调整程序的参数，使程序能够玩游戏甚至创建新程序。名为进化算法的ML方法则能多样化并迭代设计解决方案，包括其他算法。在过去十年中，“AutoML”已自动化了机器学习模型（如神经网络）的构建、训练和评估等流程。

今天，GPT、Gemini、Claude和Grok等大型语言模型（LLM）进一步拓展了这一趋势。它们最大的用例之一是编写代码，包括用于生成自身未来版本的代码。OpenAI在二月份报告称，GPT-5.3-Codex在其自我创建过程中发挥了关键作用，帮助调试训练、管理部署并分析评估结果。Anthropic则宣称，其大部分代码现在由Claude Code编写。然而，这些系统仍依赖人类的指导和验证来完成工作。

去年，Google DeepMind发布了名为AlphaEvolve的系统，一个“用于科学和算法发现的编码代理”。它利用LLM来指导解决方案的演进，例如优化神经网络架构、数据中心调度和芯片设计。这并非一个完全递归的循环，因为人们仍需决定AlphaEvolve应解决什么问题以及如何评估其性能。但每一次突破都增强了科学家实现进一步AI突破的能力。Google DeepMind的计算机科学家Matej Balog表示，这“也是人类与机器之间一个非常协作的过程”。

AI正步入“自我进化”时代：机器赋能自身迭代的探索与挑战

推荐阅读

Anthropic与SpaceX达成巨额算力合作，Colossus I助力Claude Agent发展

AI客服聊天机器人开发实战：五大经验教训与解决方案

Obsidian 本地 LLM 知识库搭建指南