News

OpenAI GPT-5.5 夺得英国安全测评冠军，网络渗透能力超越 Claude

2026年5月17日 · News

gpt-5.5aisiautonomous-agentscybersecurityreasoning

OpenAI GPT-5.5 夺得英国安全测评冠军，网络渗透能力超越 Claude

OpenAI 的最新生成式 AI 模型 GPT-5.5 在英国人工智能安全研究所（UK AISI）的严苛测试中展现了卓越的网络安全能力。通过成功应对复杂的挑战，如企业网络渗透模拟，该模型证明了 AI 作为自主问题解决者（Autonomous Problem-solver）的快速演进。

在专家级网络安全任务中，GPT-5.5 取得了 71.4% 的平均通过率，这一表现显著超越了包括 Anthropic 的 Claude 在内的竞争对手。这一里程碑式的数据凸显了 AI 在逻辑推理和自主 Agent 技术创新方面的惊人速度。

尤为引人注目的是，GPT-5.5 成为历史上第二个完全通过“The Last Ones”模拟测试的模型。这是一项包含 32 个阶段的企业网络渗透模拟任务，旨在评估模型在复杂、多步骤环境下的渗透测试能力。此次测试不仅展示了 AI 能力的巨大飞跃，也预示着未来自主系统在处理极端技术挑战时的巨大潜力。

↗ 阅读原文