⚡ News

OpenAI联合创始人Karpathy加盟Anthropic,领衔AI辅助预训练

OpenAI联合创始人Karpathy加盟Anthropic,领衔AI辅助预训练

人工智能领域知名学者、OpenAI 联合创始人兼前特斯拉 AI 负责人 Andrej Karpathy 宣布加入 Anthropic。他将在该公司由 Nick Joseph 领导的预训练(Pre-training)团队中工作。

Karpathy 在社交平台 X 上表示:“我已加入 Anthropic。我认为未来几年大语言模型(LLM)的前沿探索将极具塑造性。非常高兴能加入这里的团队并重返研发一线。”他同时强调,自己对教育事业仍充满热情,未来会找时间重新投入其中。

预训练阶段负责大规模模型的训练,为 Claude 注入核心知识和能力,也是构建前沿模型中最昂贵、算力最密集的环节之一。Anthropic 发言人透露,Karpathy 将在公司内组建一个新团队,专门研究如何利用 Claude 模型自身来加速预训练的研发工作。这表明 Anthropic 坚信,通过 AI 辅助研发(而不是单纯堆砌算力),是在与 OpenAI 和谷歌的竞争中保持领先的关键。

作为业内极少数能够跨越 LLM 理论与大规模训练工程实践的顶尖学者,Karpathy 的履历极为资深。他曾在 OpenAI 专注于深度学习与计算机视觉,2017 年加入特斯拉并主导了 FSD 及自动驾驶(Autopilot)项目。2022 年离开特斯拉后,他重返 OpenAI 工作一年,随后于 2024 年离职创办了将 AI 助手应用于教育的初创公司 Eureka Labs。目前尚不清楚他是否会继续运营该公司。此前,他还推出了广受欢迎的《Neural Networks: Zero to Hero》在线课程,并定期在 YouTube 频道上分享 LLM 知识。

与此同时,Anthropic 还宣布引入网络安全专家 Chris Rohlf 加入其前沿红队(Frontier Red Team),负责对先进模型进行抗威胁压力测试。Rohlf 拥有 20 多年行业经验,曾服务于雅虎著名的安全团队“The Paranoids”,并在 Meta 工作了六年。他还曾是乔治城大学安全与新兴技术中心(CSET)的成员,深度参与了 CyberAI 项目。

【AgentUpdate 深度解析】Andrej Karpathy 的加盟以及他所领衔的“AI 辅助预训练”团队,向行业释放了一个极其明确的信号:AI 研发正在全面转向“Agent 闭环”。传统的预训练依赖于人工设计架构和海量算力堆砌,而利用 Claude 自身的 Agent 能力来自动化寻找更优的模型架构、清洗数据和优化训练策略,将极大释放研发效率。这种“用 AI 设计 AI”的范式,本质上是 AI Agent 在前沿科研(AI for Science)领域的终极应用。横向对比来看,OpenAI 和谷歌也在探索模型自我迭代,但 Karpathy 极强的工程落地能力,可能让 Anthropic 在“自适应 self-improving Agent”的演进上抢占先机。未来,Agent 的能力边界将不再局限于应用层,而是反哺底层大模型,实现真正意义上的算法级自我演化。

↗ 阅读原文