Claude Code质量下降真相：Anthropic揭示Harness而非模型Bug

2026年4月24日消息——Anthropic公司近期针对Claude Code代码质量报告作出了回应。此前两个月，用户对Claude Code输出质量下降的投诉量激增，现在证实这些抱怨并非空穴来风，而是真实存在的问题。

Anthropic的深入调查发现，问题的根源并非AI模型本身，而是Claude Code运行环境中存在的三个独立但复杂的“Harness”（即模型与外部系统交互的框架）问题，这些问题直接影响了用户体验。

Anthropic在事后分析报告中详细阐述了这些技术细节。其中一个尤为突出的问题是：3月26日，Anthropic上线了一项更新，旨在清除闲置超过一小时的Claude会话中较旧的“思考链”，以降低用户恢复会话时的延迟。然而，一个关键的bug导致这项清除操作在会话后续的每一次交互中都会重复发生，而并非仅发生一次。这使得Claude在用户看来变得“健忘”和“重复”。

对于许多开发者而言，例如文章作者，他们经常会保持Claude Code会话闲置一小时，甚至更久（一天或数天），然后再重新激活。据估计，作者在这些“陈旧”会话中花费的提示时间甚至超过了新启动的会话。因此，这项bug对用户体验造成了显著影响。

对于正在构建AI Agent系统的开发者来说，这份报告具有重要的参考价值。它揭示了即使不考虑模型本身的非确定性，AI运行框架（harness）中出现的bug也可能极其复杂，对系统的整体表现产生深远影响。