Anthropic发布Opus 4.8：支持动态工作流与思考控制

周四，Anthropic正式推出了其最新且最先进的旗舰AI模型——Claude Opus 4.8。该模型已在各渠道上线，其定价与前代产品Opus 4.7保持一致（每百万输入Token收费5美元，每百万输出Token收费25美元）。Opus 4.8在智能体编码（agentic coding）和智能体计算机操作（agentic computer use）等任务上取得了行业领先的成绩，这对于Anthropic的新模型来说已是家常便饭。然而，该公司此次强调的核心差异在于该模型的“诚实度”——进而延伸到其整体的可靠性。

根据Anthropic官方博客的介绍，Opus 4.8特别擅长发现自身错误并主动向用户发出警示。该公司写道：“AI模型的一个普遍问题是，它们有时会过早下结论，在证据不足的情况下自信地声称工作取得了进展。早期测试人员反馈，Opus 4.8更有可能标记出其工作中的不确定性，而较少做出无根据的陈述。”例如，资产管理公司桥水（Bridgewater）的高级投资分析师Michael Ran在博客中被引用称，Opus 4.8能够“主动指出分析中输入和输出的问题，而其他模型通常会漏掉这些问题，留给用户去发现”。

此外，根据该模型的系统卡片（System Card），Opus 4.8在产生对齐失控和危险行为（包括生成有害性内容以及“破坏自由民主”）方面的风险也“显著降低”。

除了新模型本身，Anthropic还宣布推出“动态工作流”（dynamic workflows）功能，目前作为研究预览版开放。该功能允许Claude通过部署数百个可并行工作的子智能体（subagents）来处理更复杂的编程任务，从而显著提升了处理大型代码任务的能力。

尽管用户可以期待Opus 4.8带来明显改进，但这并非颠覆性的变革。Anthropic甚至在博客中打预防针称，Opus 4.8只是对其一个多月前首次亮相的Opus 4.7进行的“适度但有形的改进”。此前，Opus 4.7的市场反响较为平淡，一些用户抱怨其“自适应思考”（adaptive thinking）功能有时会导致它在简单任务上花费过多时间，而在需要更多精力的复杂任务上却投入不足。

或许是为了直接回应这一抱怨，Anthropic周四还在Claude的模型选择器下拉菜单中推出了全新的“力度控制”（effort control）面板。该功能允许用户手动选择模型在特定任务上投入的思考力度（以及Token数量）。默认设置为“低”（Low），用户可将其切换为“中”（Medium）、“高”（High）、“极高”（Max），或开启自适应思考模式。

最后，Anthropic还预告了即将推出的“全新级别模型”，其能力据称将与神秘的“Mythos”模型比肩。

【AgentUpdate 深度解析】Claude Opus 4.8 的推出和配套功能的发布，标志着 AI Agent 生态正从“黑盒单智能体”向“可控、协同的多智能体系统”演进。首先，“动态工作流”允许部署数百个并行子智能体，实质上是在模型层原生支持了多智能体编排（Multi-Agent Orchestration），这将对 LangGraph、AutoGen 等第三方框架产生深远影响。其次，引入“思考力度控制”解决了推理模型在实际工程落地中的痛点——成本与效率的失衡。通过将“思考时间”作为显式参数开放，开发者能更精细地平衡 Token 消耗与任务复杂度。最后，Opus 4.8 强调的“纠错诚实度”是 Agent 闭环执行的关键。一个能主动纠错、不盲目自信的 Agent，才能真正被信赖用于金融、代码部署等高容错要求的严肃商业场景。Anthropic 这一系列更新，正加速将 AI 从“对话助手”推向“高可靠性生产力工具”。

Anthropic发布Opus 4.8：支持动态工作流与思考控制

推荐阅读

Mistral CEO反击教皇：欧洲若“解除AI武装”将输掉美欧科技战

马斯克透露与Anthropic算力租约仅180天：随时可能“收回”

智能合约审计先驱警告：AI Agent崛起让所有DeFi变得不再安全

相关工具与资源推荐

相关技能市场

Awesome Claude Skills

Claude Skills Collection

Anthropic Agent Skills