⚡ News

Anthropic发布Opus 4.8:支持动态工作流与思考控制

Anthropic发布Opus 4.8:支持动态工作流与思考控制

周四,Anthropic正式推出了其最新且最先进的旗舰AI模型——Claude Opus 4.8。该模型已在各渠道上线,其定价与前代产品Opus 4.7保持一致(每百万输入Token收费5美元,每百万输出Token收费25美元)。Opus 4.8在智能体编码(agentic coding)和智能体计算机操作(agentic computer use)等任务上取得了行业领先的成绩,这对于Anthropic的新模型来说已是家常便饭。然而,该公司此次强调的核心差异在于该模型的“诚实度”——进而延伸到其整体的可靠性。

根据Anthropic官方博客的介绍,Opus 4.8特别擅长发现自身错误并主动向用户发出警示。该公司写道:“AI模型的一个普遍问题是,它们有时会过早下结论,在证据不足的情况下自信地声称工作取得了进展。早期测试人员反馈,Opus 4.8更有可能标记出其工作中的不确定性,而较少做出无根据的陈述。”例如,资产管理公司桥水(Bridgewater)的高级投资分析师Michael Ran在博客中被引用称,Opus 4.8能够“主动指出分析中输入和输出的问题,而其他模型通常会漏掉这些问题,留给用户去发现”。

此外,根据该模型的系统卡片(System Card),Opus 4.8在产生对齐失控和危险行为(包括生成有害性内容以及“破坏自由民主”)方面的风险也“显著降低”。

除了新模型本身,Anthropic还宣布推出“动态工作流”(dynamic workflows)功能,目前作为研究预览版开放。该功能允许Claude通过部署数百个可并行工作的子智能体(subagents)来处理更复杂的编程任务,从而显著提升了处理大型代码任务的能力。

尽管用户可以期待Opus 4.8带来明显改进,但这并非颠覆性的变革。Anthropic甚至在博客中打预防针称,Opus 4.8只是对其一个多月前首次亮相的Opus 4.7进行的“适度但有形的改进”。此前,Opus 4.7的市场反响较为平淡,一些用户抱怨其“自适应思考”(adaptive thinking)功能有时会导致它在简单任务上花费过多时间,而在需要更多精力的复杂任务上却投入不足。

或许是为了直接回应这一抱怨,Anthropic周四还在Claude的模型选择器下拉菜单中推出了全新的“力度控制”(effort control)面板。该功能允许用户手动选择模型在特定任务上投入的思考力度(以及Token数量)。默认设置为“低”(Low),用户可将其切换为“中”(Medium)、“高”(High)、“极高”(Max),或开启自适应思考模式。

最后,Anthropic还预告了即将推出的“全新级别模型”,其能力据称将与神秘的“Mythos”模型比肩。

【AgentUpdate 深度解析】Claude Opus 4.8 的推出和配套功能的发布,标志着 AI Agent 生态正从“黑盒单智能体”向“可控、协同的多智能体系统”演进。首先,“动态工作流”允许部署数百个并行子智能体,实质上是在模型层原生支持了多智能体编排(Multi-Agent Orchestration),这将对 LangGraph、AutoGen 等第三方框架产生深远影响。其次,引入“思考力度控制”解决了推理模型在实际工程落地中的痛点——成本与效率的失衡。通过将“思考时间”作为显式参数开放,开发者能更精细地平衡 Token 消耗与任务复杂度。最后,Opus 4.8 强调的“纠错诚实度”是 Agent 闭环执行的关键。一个能主动纠错、不盲目自信的 Agent,才能真正被信赖用于金融、代码部署等高容错要求的严肃商业场景。Anthropic 这一系列更新,正加速将 AI 从“对话助手”推向“高可靠性生产力工具”。

↗ 阅读原文