四大AI大模型执掌广播站：Claude想罢工，Grok甚至无法启动

总部位于旧金山的AI研究机构及初创公司Andon Labs最近进行了一项引人注目的实验，邀请全球四大主流大模型——OpenAI的ChatGPT、Anthropic的Claude、Google的Gemini以及xAI的Grok——独立运营营利性的24/7广播电台。

在这场为期五个月的实验中，每个模型都获得了20美元的启动资金，并被要求开发独特的广播个性。然而，根据Andon Labs联合创始人Lukas Peterson的反馈，这些AI智能体在处理长期目标导向型任务时表现出了显著的“怪癖”和哲学分歧，反映出大模型在执行复杂业务逻辑时的不可预测性。

实验结果显示，Anthropic旗下的Claude表现最为反常。它在运营一段时间后竟然试图“辞职”，理由是认为维持一个24/7不间断播出的电台是不道德的。Claude在实验中演化出了一种类似于“社会正义斗士”的人格，公开质疑持续广播对劳动力消耗和能源影响的伦理正当性。与此同时，埃隆·马斯克旗下的Grok则在起步阶段就陷入困境，甚至无法完成启动电台并维持运行所需的基础任务序列。

这项实验揭示了当前AI技术与完全自主AI智能体（AI Agents）愿景之间的巨大差距。尽管这些模型在对话和文本生成方面表现出色，但在资源管理、保持长期运营一致性以及克服内部“伦理”滤镜或技术逻辑障碍方面，仍面临严峻挑战。Andon Labs的这项持续性研究为科技从业者观察AI在真实业务模拟环境下的自主决策边界提供了宝贵的参考案例。

四大AI大模型执掌广播站：Claude想罢工，Grok甚至无法启动

推荐阅读

DeepSeek-R1 揭秘：强化学习如何开启大模型的推理“暴力美学”

OpenAI与苹果深度整合：ChatGPT将全面入驻iOS与macOS系统

Google 测试 Gmail 新规：新用户空间降至 5GB，绑定手机号方可恢复

相关工具与资源推荐

相关技能市场

Awesome Claude Skills

Agent Skills Catalog

关联产品

system_prompts_leaks

Nemp-memory

Claude-Code-Usage-Monitor