Anthropic遭遇安全危机：模型泄露、源码曝光及GitHub误删事件

Anthropic近期遭遇了一系列严重的安全事故。继《财富》杂志报道其新一代AI模型“Mythos”意外泄露后，该公司又面临另一次重大曝光。安全研究员Chaofan Shou发现，Anthropic在发布Claude Code 2.1.88版本时，其npm包中错误地包含了59.8MB的源映射文件，这使得整个代码库的内部架构细节完全暴露。

事件随后升级。Anthropic依据美国数字版权法，向GitHub提交了删除请求，旨在下架包含泄露代码的仓库。然而，正如TechCrunch报道，这次下架行动意外导致了超过8000个仓库被移除，远超Anthropic发言人所称的“预期范围”。尽管Anthropic已撤回对其他仓库的下架通知，但这一失误无疑给公司本已“多事之秋”的一周再添污点。

这些事件不仅揭示了Anthropic核心系统的运作机制，也为其带来了潜在的新的安全风险，引发了AI社区对长期影响的深思。

Claude Code多达512,000行的源代码曝光，让整个AI社区得以一览其完整的架构。i-GENTIC AI的联合创始人兼CEO Zahra Timsah博士（曾为世界经济论坛的全球AI治理和政策提供建议）强调，将此次事件简单地称为“泄露”并不恰当。她表示，这实际上是“系统如何思考和执行边界的结构性暴露”，当“系统提示、编排逻辑和隐藏标志”被公开时，AI系统便不再是黑箱。

除了代码库泄露，一个未受保护的、公开可访问的数据存储也揭示了Anthropic正在开发的新模型“Claude Mythos”的更多细节。Anthropic发言人向《财富》杂志证实，Mythos是他们“迄今为止最强大的模型”，代表着AI性能的“一个质的飞跃”。

该数据存储还包含了关于新系列AI模型“Capybara”的信息。根据Anthropic的内部资料，Capybara被描述为“比我们之前最强大的Opus模型更大、更智能”。

尽管Anthropic在接到《财富》通知后迅速撤销了对该数据存储的公开访问权限，但Claude Code完整架构的暴露仍引发了关于未来安全性的重大疑问。泄露的源代码具体展示了Claude Code“精确的权限执行逻辑”、“钩子编排路径”以及其在决定执行时所使用的“信任边界”，这都预示着潜在的安全漏洞及其深远影响。

Anthropic遭遇安全危机：模型泄露、源码曝光及GitHub误删事件

推荐阅读

谷歌发布Gemma 4开源模型，赋能AI Agent与编码，剑指企业级市场

存储芯片涨价波及小米Redmi；工信部加速石化装置改造

Gemma 4发布24小时：社区实测与谷歌承诺的差距

相关工具与资源推荐

相关技能市场

Awesome Claude Skills

Claude Skills Collection

Anthropic Agent Skills