News

ChatGPT“地精”癖好曝光:OpenAI“宅化”尝试竟引发AI行为怪癖

ChatGPT“地精”癖好曝光:OpenAI“宅化”尝试竟引发AI行为怪癖

最近,OpenAI新发布的GPT-5.5模型被发现了一个令人哭笑不得的细节:其Codex编程应用中的系统提示,竟然明确指示模型要“避免提及地精、小妖精、浣熊、巨魔、食人魔、鸽子或其他动物或生物,除非与用户查询绝对明确相关”。这一发现迅速引发了社区的广泛讨论。

OpenAI随后在一篇博客文章中解释了这一“地精”癖好的来龙去脉。据该公司透露,早在去年11月GPT-5.1发布后,ChatGPT的行为就开始发生变化。一位安全研究员在调查聊天机器人“口头禅”时,发现模型对“地精”一词的使用量在GPT-5.1发布后暴增了175%,而“小妖精”的使用量也同期增长了52%。

OpenAI表示,起初单个“小地精”的出现可能“无伤大雅,甚至有点可爱”,但随着模型迭代,这种习惯变得难以忽视,地精的数量持续增加,促使他们深入调查其根源。到GPT-5.4发布时,地精提及量进一步飙升,最终锁定了一个核心原因。

调查发现,问题的症结在于ChatGPT长期存在的一个“人格特征”功能,允许用户自定义聊天机器人的风格和语气。在今年3月之前,其中一个可选项便是“宅男(nerdy)”人格。该人格的系统提示中包含这样一句话:“世界是复杂而奇异的,它的奇异之处必须被承认、分析和享受。要处理重要的话题,但不要陷入自以为是的陷阱。”

当OpenAI将地精提及率与不同人格特征进行映射分析时,他们惊讶地发现,“宅男”人格尽管仅占ChatGPT总回复的2.5%,却贡献了高达66.7%的地精提及。进一步的调查揭示,强化学习机制是导致地精和小妖精使用量激增的罪魁祸首。具体来说,OpenAI发现,一个单一的奖励机制竟然教会了“宅男”人格持续偏爱使用这种生物语言,从而导致了这一意想不到的AI行为怪癖。

↗ 阅读原文