Anthropic联合创始人兼可解释性研究负责人Christopher Olah日前在梵蒂冈发声,提出一个前所未有的观点:前沿人工智能(AI)的发展不能仅仅依赖AI实验室。这一声明是在教宗利奥十四世发布《崇高人性》(Magnifica humanitas)的首部通谕的正式介绍会上作出的。
Olah明确指出,“每一个前沿AI实验室”都“在面临一套激励与约束机制,这些机制有时可能与‘做正确的事’相冲突”。他进一步解释说,即使是出于良好意愿的研究人员,也无法摆脱这些力量的影响。因此,他得出的结论是,来自宗教领袖、政府和民间社会机构的外部监督至关重要。
Olah演讲的另一半聚焦于劳动力问题。他向与会者表示,AI“极有可能”大规模取代人类工作。他强调,“如果这种情况发生,支持那些被取代的劳动者将是一项具有历史意义的道德 imperative。”这是迄今为止,前沿AI实验室创始人首次公开且具体地承认,其公司开发的技术可能以超出劳动力市场再吸收能力的速度造成就业流失。
Anthropic此次在梵蒂冈的亮相,在过去两周内已成为今年所有AI公司中最引人注目的重新定位。此前,该公司宣布设立米兰办事处,现在,它更是置身于天主教会自1891年利奥十三世颁布涉及工业资本的《新事》通谕以来,就技术问题发表的最具深远意义的声明之中。
Olah在Anthropic的具体职责是领导其可解释性研究,这项工作被公司视为其在AI安全可信度方面最有力的证明:他负责的团队正试图逆向工程,以理解前沿模型内部的实际运作机制。
此番表态的政治背景与道德背景恰恰相反。此前,Anthropic在春季与美国政府发生了两起独立冲突。四月份,五角大楼因Anthropic自身的使用限制,将其从顶级机密AI工作中排除,并转而与英伟达、微软和AWS签署协议。此外,特朗普政府阻止了其自动漏洞发现模型Mythos的扩展,该模型此前已在全球银行业网络安全治理领域引起震动。在此背景下,Olah与教宗同台呼吁外部监督,无疑是对这些事件的直接回应。