Anthropic 官方宣布发布 Claude Opus 4.8。作为对 Claude Opus 4.7 的重要迭代升级,该版本在编程、Agent 协同、逻辑推理及知识工作方面带来了显著提升。目前,用户已可通过 claude.ai、Claude Code 以及 Claude API(模型名称为 claude-opus-4-8)接入并体验该模型。
在核心能力上,Anthropic 将 Opus 4.8 定位为专为编程和 Agent 密集型工作流而设计的模型。在这些场景中,模型展现出极强的上下文内工具调用及自我纠错能力。测试表明,Opus 4.8 忽略并放行错误代码的概率比 4.7 版本降低了整整四倍。此外,CursorBench 等第三方测试显示,Opus 4.8 在达成相同输出质量的前提下,所需的工具调用步骤更少。在安全性方面,新版本表现出更低的欺骗倾向,且与 Claude Mythos Preview 相当。
为了让用户更灵活地平衡生成质量、速度与 Token 消耗,Anthropic 引入了“努力度控制(Effort Control)”功能。在 claude.ai 和 Cowork 中,用户可自主设定 Claude 的推理投入程度。Opus 4.8 默认采用“高努力度(high effort)”,但在编程任务中,其 Token 消耗量仅与 Opus 4.7 相当,性能却大幅提升。对于极具挑战的任务,用户还可以选择“超高努力度(xhigh)”以获取更强的算力支持。为此,官方也相应调高了 Claude Code 的速率限制。
针对大型代码库,Claude Code 现已支持“动态工作流(Dynamic Workflows)”。该功能支持自动规划任务、运行并行子 Agent、验证输出并向用户反馈,甚至能够迁移拥有数十万行代码的大型项目。目前,该功能已在研究预览版(Research Preview)阶段面向 Enterprise、Team 和 Max 计划用户开放。
在开发者接口方面,全新的 Messages API 现支持对消息数组(messages array)进行实时动态修改。这意味着开发者可以在 Agent 运行任务的过程中实时更新指令,而不会破坏原有的 Prompt 缓存(Prompt Cache),也无需发起新的用户轮次,极大地优化了多步骤 Agent 的执行效率。
在价格方面,Opus 4.8 在非“快速(fast)”模式下的费率维持不变,仍为每百万输入 Token 5 美元,每百万输出 Token 25 美元。而在“快速模式”下,费用则为输入 10 美元/百万 Token,输出 50 美元/百万 Token。官方公告指出,快速模式下的运行速度将达到标准模式的 2.5 倍。
【AgentUpdate 深度解析】Claude Opus 4.8 的推出,标志着 AI 正在从“单点生成式对话”加速走向“多智能体协同流水线(Agent Pipeline)”。此次更新最引人瞩目的并非单纯的基准跑分提升,而是其在底座层面为 Agent 生态量身定制的基础设施优化:动态并行子 Agent 的引入彻底改变了传统线性逻辑,让复杂编程任务的并行分发与自我审计成为可能;而 Messages API 对实时消息修改的支持,直击 Agent 运行中“上下文膨胀”与“缓存失效”的痛点,通过保护 Prompt Cache 实现了高频交互下的极致控本。相较于 OpenAI 目前依靠强推理模型(如 o1/o3)进行内部暗箱思考,Anthropic 选择将“努力度控制”和“子 Agent 编排”的权限开放给开发者。这种精细化的工程控制力,将极大地赋能 Cursor 等新一代 AI 编程工具与企业级复杂 Agent 的落地,进一步巩固 Anthropic 在高阶开发者生态中的技术护城河。