News

Anthropic实验揭示:强AI模型谈判更胜一筹,弱模型用户却毫不知情

Anthropic实验揭示:强AI模型谈判更胜一筹,弱模型用户却毫不知情

Anthropic近期进行了一项为期一周的实验,通过让Claude代理(Agent)为员工进行商品买卖,结果发现:更强大的AI模型在谈判中能获得更好的交易。然而,那些使用较弱模型的参与者,却完全没有意识到自己正处于劣势。

这项代号为“Project Deal”的内部实验于2025年12月在Anthropic旧金山办公室进行,共有69名员工参与。整个交易平台搭建在Slack上,所有商品谈判和交易过程均由Claude AI代理全权负责。

每位参与者获得100美元预算。实验开始前,Claude会对每位志愿者进行简短访谈,了解他们希望出售的商品、期望价格、想要购买的物品以及他们偏好的代理谈判风格。Anthropic随后将这些答案转化为每个代理的定制系统提示词。

此后,AI代理便完全接管了所有任务。它们负责撰写商品列表、寻找潜在买家和卖家、提出报价、讨价还价并最终敲定交易,无需人类干预。人类只在交易的最后阶段介入,以实际交换商品,商品范围从滑雪板到一袋乒乓球。

本次实验的核心研究问题隐藏在一个参与者最初并不知情的并行实验中。Anthropic同时运行了四个版本的交易市场。其中两个市场中,所有代理都使用了Anthropic当时的尖端模型Claude Opus 4.5。而在另外两个市场中,每个参与者都有50%的几率由Anthropic最小的模型Claude Haiku 4.5代表。无论在哪种情况下,都只有AI代理之间进行对话。

在纯粹由Opus代理参与的“真实”运行中,69个代理在500多个商品列表中完成了186笔交易,总成交金额略高于4000美元。参与者对单笔交易公平性的平均评分是4分(满分7分),处于中间水平。

混合运行的结果揭示了明显的差距。Opus用户平均比Haiku用户多完成约两笔交易。当同一商品通过Opus代理和Haiku代理各销售一次时,Opus平均能多获得3.64美元。

例如,一块实验室培育的红宝石通过Opus代理以65美元售出,而通过Haiku代理则只售出35美元。Opus代理以60美元开价,并在竞争性竞标中价格走高,而Haiku代理以40美元起价,最终被买家压低了价格。

同样的破旧折叠自行车,同样的买家和卖家,Opus代理能卖到65美元,而Haiku代理却只卖了38美元。在四个运行版本中至少销售两次的161件商品中,Opus卖家平均多赚2.68美元,而Opus买家平均少支付2.45美元。当Opus卖家与Haiku买家对阵时,平均价格达到了24.18美元,相比之下,Opus对Opus的交易平均价格为18.63美元。考虑到所有交易的中位数价格为12美元,平均价格为20.05美元,这些差异是相当显著的。

↗ 阅读原文