News

Claude Code质量下降真相:Anthropic揭示Harness而非模型Bug

Claude Code质量下降真相:Anthropic揭示Harness而非模型Bug

2026年4月24日消息——Anthropic公司近期针对Claude Code代码质量报告作出了回应。此前两个月,用户对Claude Code输出质量下降的投诉量激增,现在证实这些抱怨并非空穴来风,而是真实存在的问题。

Anthropic的深入调查发现,问题的根源并非AI模型本身,而是Claude Code运行环境中存在的三个独立但复杂的“Harness”(即模型与外部系统交互的框架)问题,这些问题直接影响了用户体验。

Anthropic在事后分析报告中详细阐述了这些技术细节。其中一个尤为突出的问题是:3月26日,Anthropic上线了一项更新,旨在清除闲置超过一小时的Claude会话中较旧的“思考链”,以降低用户恢复会话时的延迟。然而,一个关键的bug导致这项清除操作在会话后续的每一次交互中都会重复发生,而并非仅发生一次。这使得Claude在用户看来变得“健忘”和“重复”。

对于许多开发者而言,例如文章作者,他们经常会保持Claude Code会话闲置一小时,甚至更久(一天或数天),然后再重新激活。据估计,作者在这些“陈旧”会话中花费的提示时间甚至超过了新启动的会话。因此,这项bug对用户体验造成了显著影响。

对于正在构建AI Agent系统的开发者来说,这份报告具有重要的参考价值。它揭示了即使不考虑模型本身的非确定性,AI运行框架(harness)中出现的bug也可能极其复杂,对系统的整体表现产生深远影响。

↗ 阅读原文