News

AI编程助手提高效率是假象?研究称经验开发者反而变慢

AI编程助手提高效率是假象?研究称经验开发者反而变慢

开发者们普遍认为AI编程助手能让他们工作更快。然而,最新数据却讲述了一个截然不同的故事。在2025年软件工程研究中,一项引人注目的发现指出,经验丰富的程序员在使用前沿AI工具时,完成任务的时间实际上比没有助手的情况下长了19%。与此同时,这些开发者却坚信AI将他们的工作效率提升了20%。

这种感知上的巨大差异不仅仅是一个有趣的心理现象。它揭示了开发者在使用AI辅助编程时的体验与实际生产力、代码质量和长期维护成本之间存在根本性的脱节。其影响远超个体程序员,可能重塑组织衡量软件开发绩效的方式以及团队应如何构建其工作流程。

颠覆一切的里程碑式研究

揭示这一差异的研究来自AI安全组织METR。该组织对16名经验丰富的开源开发者进行了一项随机对照试验。每位参与者平均拥有五年与其所处理的成熟项目相关的经验。研究随机分配了246项任务,允许或禁止使用AI工具,其中开发者主要使用Cursor Pro和Claude 3.5/3.7 Sonnet。

在完成分配的问题之前,开发者预测AI会让他们提速24%。即使在亲身体验到减速之后,他们仍然报告认为AI将他们的性能提高了20%。然而,客观测量结果显示恰恰相反:当可以使用AI工具时,任务完成时间反而增加了19%。

这一发现与供应商赞助的研究形成了鲜明对比。微软旗下子公司GitHub发布的研究声称,开发者使用Copilot后完成任务的速度加快了55.8%。一项由微软、埃森哲和一家财富100强企业参与的多公司研究报告称,生产力提高了26%。谷歌内部的随机对照试验发现,使用AI的开发者完成任务的速度快了21%。

这种矛盾并非意味着一些研究是错误的而另一些是正确的。相反,它反映了不同的情境、测量方法,以及至关重要的是,研究人员与AI工具供应商之间不同的关系。那些显示生产力提升的研究作者与生产或投资AI编码工具的公司有关联。虽然这并不必然使他们的发现无效,但在评估这些主张时仍需仔细考虑。

为什么开发者感觉更快,实则更慢?

多种认知偏差共同导致了这种感知差距。例如,“可见活动偏差”使得观看代码生成时感觉效率很高,即使大量时间消耗在审查、调试和纠正这些输出上。另外,由于打字减少带来的“认知负荷降低”,也可能产生工作量减少的错觉,尽管审查AI生成内容同样需要大量心智投入。

↗ 阅读原文