第2集:三家共识——相同的能力与限制

⏱ 预计阅读 3 分钟 更新于 2026/5/7
💡 进群学习加 wx: agentupdate
(申请发送: agentupdate)

尽管产品形态各异,但到了 2026 年,行业在 AI Coding Agent 的底层逻辑上已经达成了高度共识。无论你选择哪家,以下核心能力都是“标配”。

✅ 都支持的核心能力

  1. Sub-agent / 多 Agent 协作:支持将复杂任务委派给子 Agent,由其独立执行并返回结果。
  2. MCP (Model Context Protocol):统一接入外部工具(如 MySQL, Jira, 搜索引擎)的事实标准。
  3. Skills 概念:支持基于 Agent Skills 开放标准 定义的可复用原子能力。
  4. Slash Command (斜杠命令):通过输入 /fix, /test 等命令快速触发预设工作流。
  5. 跨工具的 AGENTS.md 标准:支持用同一个 Markdown 文件为三家工具下达统一的项目规则。
  6. 多模态输入:不仅读代码,还能理解图片(设计稿)和 PDF 文档。
  7. 可暂停与审批流:支持在执行高风险操作前(如写文件、跑 Bash)请求用户审批。
  8. Markdown + YAML 的扩展模式:使用开发者最熟悉的格式来定义规则和工作流。

⚠️ 共同的限制

了解能力的边界同样重要。目前三款工具都存在以下限制:

  • 主 Agent 不可替换:你不能完全用自己的逻辑替换产品自带的“主大脑”,所有扩展都是建立在官方主 Agent 之上的。
  • 系统提示词 (System Prompt) 黑盒:实际控制 Agent 行为的底层 System Prompt 由厂商控制,用户只能通过规则文件(CLAUDE.md, GEMINI.md, AGENTS.md)进行“指令注入”。

这些共识意味着:如果你掌握了其中一家的扩展开发(如写 Skill 或 Rule),迁移到另外两家的门槛将非常低。