许多人以为多智能体系统(multi-agent system)就是在一个工作区里设置更多Prompt。但在OpenClaw社区的讨论中,真正能稳定运行的多智能体方案远不止于此。成功的OpenClaw部署案例表明,它们是具备独立信任区(trust zones)的分离服务。
这种模式通常表现为三种类型的智能体:一个“图书管理员”智能体(librarian agent)、一个“执行器”智能体(executor agent)、以及一个“面向公司”智能体(company-facing agent),它们通常通过A2A(智能体到智能体)协议连接。
表面上这看似只是一个实现细节,但实则不然。在一个工作区内设置独立的Prompt,其本质仍是一个单一工作区,这意味着:共享一个上下文池(one context blob)、共享一个工具接口(one tool surface)、共享一个安全边界(one security boundary),以及容易累积冗余信息。而独立的OpenClaw实例则截然不同,它提供了真正的边界:不同的运行时环境(different runtimes)、独立的API密钥(different API keys)、独立网络配置(different networks)、独立的内存策略(different memory policies)、以及明确的任务交接(explicit handoffs)。这正是多智能体系统从“角色扮演”走向“体系架构”的关键。
Reddit上的一个r/openclaw帖子清晰展示了这一趋势,讨论了一个A2A插件的实际应用,案例包括:沙盒化的本地OpenClaw与具备完整访问权限的云端OpenClaw通信;个人OpenClaw与企业级OpenClaw连接以访问内部服务;以及团队成员智能体通过互联网同步计划,避免冲突。这并非简单的Prompt组织,而是真正的系统设计,它解答了许多试图将多智能体硬塞进一个工作空间的人的疑问。
为什么不能把所有东西都放在一个OpenClaw工作区里?因为“边界”才是关键。如果你的图书管理员、执行器和面向公司的助手都生活在同一个工作区,那么很多专业化就成了虚假的。图书管理员仍然能看到太多不该看的信息;执行器会继承过多的上下文;面向公司的助手一个错误的工具调用就可能触及不该触碰的资源。
针对不同方法,其权衡显而易见:
- **独立的A2A服务:** 提供清晰的信任边界,可在不同机器或网络上运行,但设置和安全开销是真实存在的。
- **单一OpenClaw工作区内的子智能体:** 快速简便,延迟较低,但工具和上下文隔离较弱,更容易膨胀。
- **n8n用于编排,智能体用于推理:** 非常适合确定性触发和数据传输,但胶水代码会迅速变得混乱。
作者的观点是:只有当边界真实存在时,多智能体的复杂性才值得投入。如果仅仅是将Prompt分为“研究员”和“编码器”,那很可能你只有一个智能体戴着不同的“名牌”而已。
在A2A讨论中,有评论者提出了一个值得借鉴的模式:需要一个智能体作为RAG(检索增强生成)实现的图书管理员和看门人。