OpenAI 正对其开发者工具 Codex 进行大规模升级,使其能力大幅扩展。现在,这款AI能够独立控制Mac电脑、生成图像、记忆用户偏好,并能够自主地持续工作数周。此举被视为直接对标 Anthropic 的 Claude Code。
OpenAI 为 Codex 发布了一次全面更新,将这款AI编程助手的能力从之前的终端和编辑器工具角色大大拓展。最主要的新功能是“后台计算机使用”:OpenAI 表示,Codex 现在能够通过“观察”屏幕、模拟点击和打字,利用自己的光标操作用户电脑上的任何应用程序。
在Mac上,多个Codex代理可以并行运行,且不会干扰用户在其他应用程序中的操作。OpenAI 称,这对于进行前端迭代、测试应用程序,或者处理那些不具备API接口的程序尤其有用。目前,此功能仅在 macOS 平台上可用。
Codex 应用程序现在还内置了一个浏览器,用户可以直接在网页上进行评论,从而向AI代理提供具体的指令。目前,这项功能主要面向前端和游戏开发。OpenAI 计划未来扩展此浏览器功能,使 Codex 能够完全控制浏览器,而不仅仅局限于本地网络应用。
Codex 升级为全面的软件开发伴侣
此次更新还大幅扩展了对整个软件开发工作流程的支持。例如,Codex 现在能够编辑 GitHub 上的代码审查评论、同时运行多个终端标签页,并已在测试阶段支持通过 SSH 连接到远程开发环境(devboxes)。
OpenAI 也增强了自动化能力:现有的对话线程可以被重复利用,从而保留之前建立的上下文。Codex 能够为未来的任务自行安排时间,并自主“苏醒”以继续处理长期项目,OpenAI 表示这“可能持续数天或数周”。
团队可以将这些自动化功能应用于各种场景,从处理未决的拉取请求(pull requests)和任务追踪,到监控 Slack、Gmail 和 Notion 中的对话。
图像生成与超过90款新插件
Codex 现在集成了 gpt-image-1.5 模型用于图像生成。结合截图和代码,这使得团队能够在同一个工作流程中创建和迭代产品概念、前端设计、原型图(mockups)以及游戏图形。
OpenAI 还推出了超过90款新增插件,这些插件整合了各种技能、应用集成和 MCP 服务器。新加入的插件包括用于 JIRA 管理的 Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、Databricks 的 Neon、Remotion、Render 和 Superpowers 等。这些插件赋予 Codex 更多能力,使其能从不同工具中获取上下文并直接执行操作。
功能逐步上线,部分区域限制
此次更新已立即向通过 ChatGPT 账户登录的 Codex 桌面应用用户推出。针对企业版、教育版、欧盟和英国用户的个性化功能(如上下文感知建议和记忆)将很快上线。目前,计算机使用功能仅限于 macOS 平台,欧盟和英国用户将在稍晚时间获得此功能。