News

Anthropic遭遇安全危机:模型泄露、源码曝光及GitHub误删事件

Anthropic遭遇安全危机:模型泄露、源码曝光及GitHub误删事件

Anthropic近期遭遇了一系列严重的安全事故。继《财富》杂志报道其新一代AI模型“Mythos”意外泄露后,该公司又面临另一次重大曝光。安全研究员Chaofan Shou发现,Anthropic在发布Claude Code 2.1.88版本时,其npm包中错误地包含了59.8MB的源映射文件,这使得整个代码库的内部架构细节完全暴露。

事件随后升级。Anthropic依据美国数字版权法,向GitHub提交了删除请求,旨在下架包含泄露代码的仓库。然而,正如TechCrunch报道,这次下架行动意外导致了超过8000个仓库被移除,远超Anthropic发言人所称的“预期范围”。尽管Anthropic已撤回对其他仓库的下架通知,但这一失误无疑给公司本已“多事之秋”的一周再添污点。

这些事件不仅揭示了Anthropic核心系统的运作机制,也为其带来了潜在的新的安全风险,引发了AI社区对长期影响的深思。

Claude Code多达512,000行的源代码曝光,让整个AI社区得以一览其完整的架构。i-GENTIC AI的联合创始人兼CEO Zahra Timsah博士(曾为世界经济论坛的全球AI治理和政策提供建议)强调,将此次事件简单地称为“泄露”并不恰当。她表示,这实际上是“系统如何思考和执行边界的结构性暴露”,当“系统提示、编排逻辑和隐藏标志”被公开时,AI系统便不再是黑箱。

除了代码库泄露,一个未受保护的、公开可访问的数据存储也揭示了Anthropic正在开发的新模型“Claude Mythos”的更多细节。Anthropic发言人向《财富》杂志证实,Mythos是他们“迄今为止最强大的模型”,代表着AI性能的“一个质的飞跃”。

该数据存储还包含了关于新系列AI模型“Capybara”的信息。根据Anthropic的内部资料,Capybara被描述为“比我们之前最强大的Opus模型更大、更智能”。

尽管Anthropic在接到《财富》通知后迅速撤销了对该数据存储的公开访问权限,但Claude Code完整架构的暴露仍引发了关于未来安全性的重大疑问。泄露的源代码具体展示了Claude Code“精确的权限执行逻辑”、“钩子编排路径”以及其在决定执行时所使用的“信任边界”,这都预示着潜在的安全漏洞及其深远影响。

↗ 阅读原文