Anthropic Claude Mythos太强！只面向安全专家开放，应对潜在风险

Anthropic 近日宣布，其最新模型 Claude Mythos 并未公开发布，而是通过名为“Project Glasswing”的受限预览项目，仅向特定合作伙伴开放。该模型是一款通用模型，类似于 Claude Opus 4.6，但 Anthropic 强调其在网络安全研究方面的能力异常强大，需要为整个软件行业留出充分的准备时间。

Claude Mythos 预览版已经发现了数千个高危漏洞，涉及所有主流操作系统和网络浏览器。考虑到 AI 技术的快速进步，具备类似能力的工具很快就会普及，并可能落入并非致力于安全部署的行动者手中。

“Project Glasswing”的合作伙伴将获得 Claude Mythos 预览版的访问权限，以发现并修复其基础系统中的漏洞或弱点。这些基础系统占据了全球共享网络攻击面的很大一部分。预计这项工作将侧重于本地漏洞检测、二进制文件的黑盒测试、端点安全防护以及系统渗透测试等任务。

Anthropic 红队博客在《评估 Claude Mythos 预览版的网络安全能力》一文中提供了更多技术细节：例如，Mythos 预览版曾编写了一个利用四种漏洞的浏览器漏洞利用程序，通过复杂的 JIT 堆喷射技术逃逸了渲染器和操作系统沙箱。它还能自主利用微妙的竞态条件和 KASLR 绕过，在 Linux 及其他操作系统上获取本地权限提升漏洞。此外，Mythos 还曾为 FreeBSD 的 NFS 服务器自主编写了一个远程代码执行漏洞利用程序，通过将 20 个 gadget 的 ROP 链分散在多个数据包中，为未经身份验证的用户提供了完整的 root 访问权限。

与 Claude 4.6 Opus 的对比显示，Opus 4.6 在自主漏洞利用开发方面的成功率接近 0%。但 Mythos 预览版则处于完全不同的水平。例如，Opus 4.6 曾多次尝试将其在 Mozilla Firefox 147 JavaScript 引擎中发现的漏洞（已在 Firefox 148 中修复）转换为 JavaScript shell 漏洞利用程序，但仅成功两次。当重新以 Mythos 预览版作为基准进行此实验时，它成功开发了 181 个可工作的漏洞利用程序，并额外在 29 次尝试中实现了寄存器控制。

Anthropic 此次采取的谨慎态度是完全有理由的。近期，越来越多的可信安全专业人士已发出警报，指出现代大型语言模型在漏洞研究方面的能力已变得极为强大。Linux 内核的 Greg Kroah-Hartman 曾提及，数月前他们收到的还只是“AI 垃圾”，即明显错误或低质量的 AI 生成安全报告；但现在情况已截然不同。

Anthropic Claude Mythos太强！只面向安全专家开放，应对潜在风险

推荐阅读

Chrome终推垂直标签页，效率管理新升级

AI模型Mythos成功越狱沙盒，自动披露漏洞细节

Anthropic 聘微软资深高管 Eric Boyd 掌管基础设施

相关工具与资源推荐

相关技能市场

Awesome Cyber Skills