News

Claude Opus 4.7:AI安全变“过度执法”,开发者怨声载道

Claude Opus 4.7:AI安全变“过度执法”,开发者怨声载道

Anthropic最新发布的Claude Opus 4.7引入了更严格的安全防护机制,旨在防止滥用。然而,开发者社区反馈这些措施也意外地阻碍了许多合法用途。

Anthropic此前曾发布Mythos模型,声称其在漏洞发现和利用方面能力过强,不适合公开发布。尽管这一评估可能带有公司自身的考量,但Anthropic决定将Opus 4.7作为一个试验平台,来测试高度警惕的防护策略。公司表示:“我们发布Opus 4.7时带有能够自动检测并阻止指示禁止或高风险网络安全用途请求的安全防护。从这些防护措施的实际部署中吸取的经验,将帮助我们实现最终目标,即广泛发布Mythos级别的模型。”

开发者们在Claude Code的GitHub仓库中表达了大量不满。针对Anthropic的“可接受使用政策”(AUP)分类器,异议激增,许多客户发现其合法工作难以完成。

随着安全性的提升,误报也随之增加——Claude变得过于谨慎,拒绝响应无害的请求。GitHub上的投诉趋势清晰地反映了AUP拒绝率的上升。

Claude Code用户数月来一直在GitHub issues中提出无效拒绝的担忧。从2025年7月到9月,每月约有两到三起此类投诉,例如“#4373:来自claude.ai的内存授权代码触发API策略错误”。

2025年10月至11月,与AUP相关的拒绝请求上升至每月约五到七起,包括“#8784:Claude 4.5随机拒绝正常请求并报错API错误”。

12月投诉数量有所减少,可能与美国假期有关。然而,到1月,投诉数量回升至约八起。开发者在“#16129:Claude Code中重复出现的AUP误报”中指出,“技术软件开发对话不应触发AUP违规。安全过滤器似乎对良性内容过于激进。”2月和3月的投诉数量与此类似。

而到了4月,情况急转直下,投诉数量激增。开发者们提交了超过30份关于安全性、通用开发用途和科学领域被误报的报告。其中一个例子是“#48442:AUP持续误报 — 40+次每4个会话,涉及不相关项目(心理学书籍、Web应用、基础设施、机器人)”。

↗ 阅读原文