News

Claude Code惊艳亮相:AI自主编程新里程碑

Claude Code惊艳亮相:AI自主编程新里程碑

近期,一项针对Anthropic公司AI工具Claude Code的实验,揭示了人工智能在自主编程领域取得的显著突破。实验中,用户向Claude Code发出指令,要求其开发一个每月能创造1000美元收入的、无需用户任何编程知识且由AI完全自主完成的网站或软件初创想法。

Claude Code在接收到指令后,首先提出了三个多项选择问题,随后决定创建一个销售“专业用户500个提示集”的业务,定价39美元。接下来,AI在没有任何进一步输入的情况下,独立工作了长达一小时十四分钟。在此期间,它创建了数百个代码文件和提示。最终,Claude Code提供了一个可执行文件,该文件运行后成功创建并部署了一个功能完备的网站。该网站上自动生成了一些营销文案,尽管内容略显简单,但其销售功能已准备就绪。

这次实验充分展示了Claude Code在处理复杂任务时的自主性。尽管其界面并不十分友好,但它完美地响应了用户的单一请求,经过自主访谈、长时间独立工作后,准确地交付了所需成果,且没有出现明显的错误。这标志着以Claude Code为代表的新一代AI编程工具的出现,它们在过去一个月左右的时间里实现了能力上的突然飞跃。

这种能力提升并非单一突破,而是两大进步的结合:首先,最新一代AI在自主工作和自我纠错方面(尤其在编程任务中)能力显著增强;其次,AI被赋予了“Agentic Harness”(代理工具栈或框架),使其能够以全新的方式解决问题。这两个因素共同促成了大型AI公司最新AI工具的巨大进步。

衡量AI能力的指标之一——METR(测量AI以50%的可靠性自主完成任务所需的时间,该时间通常与人类专业人士完成任务所需时间挂钩)显示,AI自主完成任务的时长呈指数级增长,近几个月尤为明显。

然而,对于大多数希望探索和实验AI的用户来说,这些新工具目前主要还是为程序员设计的。它们要求用户理解Python命令和编程最佳实践,并且界面设计看起来像是1980年代的计算机实验室产物。这些工具被明确设计用于分析、调试和编写代码,并与现有的程序员工作流程紧密结合。从某种程度上说,这是一种遗憾,因为这些系统实际上对各行各业的知识工作者都具有广泛的实用价值。通过亲身体验这些工具,人们可以深入了解AI的未来发展方向。

↗ 阅读原文