Anthropic近期发布了关于Project Glasswing项目的最新进展报告。该AI项目于上月启动,核心目标是利用人工智能技术,保护关键软件系统免受恶意AI模型的攻击。
在此之前,Anthropic曾开发出代号为Claude Mythos的强大新模型。该模型在发现代码安全漏洞方面的能力令人惊叹,但正是因为其强大的能力,Anthropic考虑到潜在的滥用风险,最终决定不向公众广泛发布这款模型。作为替代方案,Anthropic选择将Mythos模型分享给约50家关键合作伙伴,其中包括科技行业的诸多巨头,例如AWS、苹果、谷歌、微软、CrowdStrike、英伟达、博通、思科和Palo Alto Networks等。
Anthropic针对Mythos模型的早期研究结果已经带来了一些关键的洞察。其中,最引人注目的无疑是相关数据,这些数据将进一步揭示该模型在漏洞发现方面的强大潜力。