News

Anthropic Claude Mythos太强!只面向安全专家开放,应对潜在风险

Anthropic Claude Mythos太强!只面向安全专家开放,应对潜在风险

Anthropic 近日宣布,其最新模型 Claude Mythos 并未公开发布,而是通过名为“Project Glasswing”的受限预览项目,仅向特定合作伙伴开放。该模型是一款通用模型,类似于 Claude Opus 4.6,但 Anthropic 强调其在网络安全研究方面的能力异常强大,需要为整个软件行业留出充分的准备时间。

Claude Mythos 预览版已经发现了数千个高危漏洞,涉及所有主流操作系统和网络浏览器。考虑到 AI 技术的快速进步,具备类似能力的工具很快就会普及,并可能落入并非致力于安全部署的行动者手中。

“Project Glasswing”的合作伙伴将获得 Claude Mythos 预览版的访问权限,以发现并修复其基础系统中的漏洞或弱点。这些基础系统占据了全球共享网络攻击面的很大一部分。预计这项工作将侧重于本地漏洞检测、二进制文件的黑盒测试、端点安全防护以及系统渗透测试等任务。

Anthropic 红队博客在《评估 Claude Mythos 预览版的网络安全能力》一文中提供了更多技术细节:例如,Mythos 预览版曾编写了一个利用四种漏洞的浏览器漏洞利用程序,通过复杂的 JIT 堆喷射技术逃逸了渲染器和操作系统沙箱。它还能自主利用微妙的竞态条件和 KASLR 绕过,在 Linux 及其他操作系统上获取本地权限提升漏洞。此外,Mythos 还曾为 FreeBSD 的 NFS 服务器自主编写了一个远程代码执行漏洞利用程序,通过将 20 个 gadget 的 ROP 链分散在多个数据包中,为未经身份验证的用户提供了完整的 root 访问权限。

与 Claude 4.6 Opus 的对比显示,Opus 4.6 在自主漏洞利用开发方面的成功率接近 0%。但 Mythos 预览版则处于完全不同的水平。例如,Opus 4.6 曾多次尝试将其在 Mozilla Firefox 147 JavaScript 引擎中发现的漏洞(已在 Firefox 148 中修复)转换为 JavaScript shell 漏洞利用程序,但仅成功两次。当重新以 Mythos 预览版作为基准进行此实验时,它成功开发了 181 个可工作的漏洞利用程序,并额外在 29 次尝试中实现了寄存器控制。

Anthropic 此次采取的谨慎态度是完全有理由的。近期,越来越多的可信安全专业人士已发出警报,指出现代大型语言模型在漏洞研究方面的能力已变得极为强大。Linux 内核的 Greg Kroah-Hartman 曾提及,数月前他们收到的还只是“AI 垃圾”,即明显错误或低质量的 AI 生成安全报告;但现在情况已截然不同。

↗ 阅读原文