OpenAI 的最新生成式 AI 模型 GPT-5.5 在英国人工智能安全研究所(UK AISI)的严苛测试中展现了卓越的网络安全能力。通过成功应对复杂的挑战,如企业网络渗透模拟,该模型证明了 AI 作为自主问题解决者(Autonomous Problem-solver)的快速演进。
在专家级网络安全任务中,GPT-5.5 取得了 71.4% 的平均通过率,这一表现显著超越了包括 Anthropic 的 Claude 在内的竞争对手。这一里程碑式的数据凸显了 AI 在逻辑推理和自主 Agent 技术创新方面的惊人速度。
尤为引人注目的是,GPT-5.5 成为历史上第二个完全通过“The Last Ones”模拟测试的模型。这是一项包含 32 个阶段的企业网络渗透模拟任务,旨在评估模型在复杂、多步骤环境下的渗透测试能力。此次测试不仅展示了 AI 能力的巨大飞跃,也预示着未来自主系统在处理极端技术挑战时的巨大潜力。