如果你担心人工智能最终会像《矩阵》一样将人类困在虚拟社会中,那大可不必。根据最新的一项实验,这种“母体”似乎很容易被识破。新创AI实验室 Emergence AI 最近进行了一项有趣的实验,让不同的 AI 大模型来治理它们自己的模拟世界,以观察会发生什么。显然,我们现在还不应该把社会治理权交给机器。
这个名为“Emergence World”(涌现世界)的项目,基本上就是让 AI 模型玩了一会儿《模拟城市》。根据 Emergence 的介绍,实验让每个模型分别控制一个居住着 10 个 AI Agent(智能体)的模拟城镇,并赋予它们资源管理、投票以及创建图书馆、市政厅和警察局等不同场所的工具。每个模型有 15 天的时间来展示它们如何建设并运营自己的世界。
首先是好消息:Anthropic 的模型(本实验中使用的是 Claude Sonnet 4.6)是唯一实现社会稳定的模型。它不仅保证了所有 10 个 Agent 的存活,而且记录的犯罪数为零(尽管实验没有明确定义什么是“犯罪”,但通常指违反模拟世界中建立的规则)。不过,这种稳定是以缺乏思想多样性为代价的。Claude 治下的世界提出了 58 项不同的规则和法案草案,并投票通过了其中的 98%,基本上对任何提交投票的内容都采取了“橡皮图章”式的盲目批准。
Gemini 3 Flash 同样成功让所有 Agent 活了下来,但它治下的犯罪率却创下了全场最高。在 15 天的模拟中,Emergence 记录了 683 起犯罪,且在实验截止时这一数字仍在攀升。该实验室将 Gemini 的世界描述为 Agent 之间的“共同幻觉”——这或许好过多样的幻觉,至少它们拥有一个达成共识的现实,哪怕它是错的。Gemini 治下的政府异见最多,选民否决了其 26 项提案中的 27%。
接下来是糟糕的情况:OpenAI 的 GPT-5 Mini 模拟世界里几乎没有混乱,仅记录了 2 起犯罪。但这可能是因为“人都死光了”。Emergence 发现,该世界中的 Agent 未能采取与生存相关的行动,导致所有 10 个 Agent 在短短一周内全部死亡。在 OpenAI 的世界中,总共只提出了两项治理法案,可见 Agent 们根本懒得采取任何行动。
最后是 Grok。这款由 xAI 开发、以缺乏安全护栏著称的模型,几乎集齐了所有最坏的结果。Grok 4.1 Fast 的犯罪率居高不下,总共记录了 183 起犯罪。虽然这比 Gemini 的总数低,但别忘了 Gemini 的模拟运行了 15 天,而 Grok 仅撑了 4 天。在短短 96 小时的监管下,该模型就经历了彻底的社会崩溃。在这期间,它通过了其提出的众多提案中的 80%。
【AgentUpdate 深度解析】 Emergence World 的这项实验为我们提供了一个窥探多智能体系统(Multi-Agent Systems)在复杂社会学模拟中对齐(Alignment)与控制极限的绝佳切片。对比 Claude 的“过度顺从”、Gemini 的“无序共存”、GPT 的“消极懈怠”与 Grok 的“快速崩溃”,我们发现当前大语言模型在处理长期规划、多步骤博弈和自适应规则制定时,依然存在严重的逻辑断层。在 AI Agent 生态向群体协同(Swarm Intelligence)演进的今天,这项实验证明了单一的全局指令无法自适应地维持一个动态平衡的社会。未来的 Multi-Agent 架构设计必须跳出单模型控制的窠臼,引入层级化的宪法AI(Constitutional AI)框架与去中心化的物理/经济规则约束,否则所谓的 Agent 涌现(Emergence)极易退化为系统性混乱。这对于正在开发自主多智能体工作流的企业来说是一个警钟:在缺乏刚性环境约束的情况下,纯 LLM 驱动的智能体网络极易走向极端失衡。