摘要

1) 一句话总结 全新发布的 macOS 版 Codex 桌面应用作为一个多智能体指挥中心,支持开发者并行管理任务、扩展自定义技能并实现工作流自动化,旨在重塑软件开发的全生命周期。

2) 核心要点

  • 发布与额度:macOS 版正式上线,限时向 ChatGPT Free 和 Go 用户免费开放,同时为 Plus、Pro、Business、Enterprise 和 Edu 用户提供双倍速率限制(适用于桌面端、CLI、IDE 扩展及云端)。
  • 多任务与防冲突:支持按项目组织的独立线程进行多任务处理;内置 Worktrees 支持,使多个智能体能在隔离的代码副本上并行工作而不产生冲突,并自动同步 CLI 和 IDE 的会话状态。
  • 技能(Skills)扩展:通过打包指令、资源和脚本,将能力扩展至非代码领域。内置技能库支持 Figma 转 UI、Linear 项目管理、云端部署(Vercel 等)、图像生成及文档处理,自定义技能可提交至代码仓库与团队共享。
  • 自动化(Automations):支持设置计划任务让 Codex 在后台处理重复性工作(如 Issue 分类、总结 CI 失败原因等),任务完成后结果将进入审查队列供人工确认。
  • 个性化交互:提供“简明务实”和“对话式且富有共情”两种性格,开发者可通过 /personality 命令自由切换。
  • 安全与沙盒机制:默认采用开源的系统级沙盒,智能体仅限在指定文件夹或分支内操作及使用缓存网络搜索,高权限命令需用户授权或提前配置规则。
  • 使用数据与案例:自 12 月中旬发布 GPT-5.2-Codex 以来使用量翻倍,近一个月超 100 万开发者使用;在官方测试中,Codex 仅凭初始提示词消耗超 700 万 Token 独立完成了 3D 赛车游戏的开发与测试。

3) 风险与不足(基于原文明确提及)

  • 平台限制:目前仅发布了 macOS 版本,Windows 版本仍在计划开发中。
  • 自动化运行限制:当前的自动化功能依赖本地环境,仅在电脑开启时才能运行(基于云端的触发器仍在开发中)。
  • 现有工具的局限性:原文指出,现有的 IDE 和基于终端的工具已无法满足大规模指导、监督多智能体协作的全新工作方式(这也是推出独立桌面端的原因)。

正文

今天,我们正式推出 macOS 版 Codex 桌面应用。这是一款强大的全新界面,旨在帮助开发者轻松管理多个智能体、并行处理任务,并在长期任务中与智能体进行无缝协作。

为了让更多人体验 Codex 的强大功能,我们在有限时间内向 ChatGPT Free 和 Go 用户免费开放 Codex,并为 Plus、Pro、Business、Enterprise 和 Edu 计划的用户提供双倍的速率限制。这些提升的额度适用于所有使用 Codex 的场景——包括桌面端、CLI、IDE 扩展以及云端。

Codex 桌面端正在改变软件的构建方式以及开发者的门槛:从与单一编程智能体结对进行针对性修改,转变为在设计、构建、发布和维护软件的全生命周期中,监督并协调多个智能体团队。

智能体的指挥中心:支持多任务并行

自 2025 年 4 月推出 Codex 以来,开发者与智能体的工作方式发生了根本性变化。现在的模型能够端到端地处理复杂的长期任务,开发者也开始在项目中协调多个智能体:分配工作、并行运行任务,并放心地将耗时数小时、数天甚至数周的重大项目交给智能体。核心挑战已经从“智能体能做什么”转变为“人们如何在大规模下指导、监督并与它们协作”。现有的 IDE 和基于终端的工具已无法满足这种全新的工作方式。

为此,我们推出了 Codex 桌面端——一个专属的智能体指挥中心。

  • 无缝多任务处理:智能体在按项目组织的独立线程中运行,你可以随时切换任务而不会丢失上下文。你可以在线程中审查智能体的更改、对差异(diff)发表评论,甚至在编辑器中打开并手动修改。
  • 内置工作树(Worktrees)支持:多个智能体可以在同一个代码库上工作而不会产生冲突。每个智能体都在代码的隔离副本上运行,允许你探索不同的开发路径,而无需担心影响主代码库。
  • 状态同步:应用会自动同步你在 Codex CLI 和 IDE 扩展中的会话历史与配置,让你能立即在现有项目中上手使用。

通过“技能”拓展能力边界

Codex 正在从一个单纯“写代码”的智能体,进化为一个“用代码在电脑上完成工作”的智能体。借助**技能(Skills)**功能,你可以轻松将 Codex 的能力扩展到信息收集与合成、问题解决、写作等更多领域。

技能将指令、资源和脚本打包在一起,使 Codex 能够可靠地连接工具、运行工作流,并按照团队的偏好完成任务。Codex 桌面端包含一个专门的界面来创建和管理技能。你可以明确要求 Codex 使用特定技能,或者让它根据当前任务自动调用。

案例:独立开发 3D 赛车游戏 我们曾要求 Codex 制作一款名为《Voxel Velocity》的 3D 赛车游戏。借助图像生成技能(由 GPT Image 驱动)和网页游戏开发技能,Codex 仅凭一个初始提示词,就独立消耗了超过 700 万个 Token 完成了游戏的构建。它同时扮演了设计师、游戏开发者和 QA 测试员的角色,甚至通过实际试玩来验证自己的工作成果。

在开发过程中,Codex 接收了极其详尽的初始指令(包括 8 条赛道、8 个角色、街机驾驶手感、漂移充能系统、道具分布及 AI 难度等),随后系统通过随机提示词不断引导它继续完善游戏,例如要求它:“试玩游戏,找出与原版缺失的功能并实现它们,测试确认有效,并优先修复试玩中发现的 Bug。”

在 OpenAI 内部,我们已经构建了数百个技能,用于将难以统一定义的工作委托给 Codex。桌面端内置了一个技能库,涵盖了许多热门工具和工作流:

  • 实现设计:从 Figma 获取设计上下文和截图,并将其转化为具有 1:1 视觉还原度的生产级 UI 代码。
  • 项目管理:在 Linear 中对 Bug 进行分类、追踪发布进度并管理团队工作量。
  • 云端部署:让 Codex 将你的 Web 应用部署到 Cloudflare、Netlify、Render 和 Vercel 等流行云平台上。
  • 生成图像:使用图像生成技能创建和编辑网页、UI 视觉图或游戏素材。
  • 构建 OpenAI API:在开发时自动参考最新的 OpenAI API 文档。
  • 创建文档:读取、创建和编辑具有专业排版的 PDF、电子表格和 Word 文档。

你创建的技能可以在桌面端、CLI 或 IDE 扩展中通用,还可以将其提交到代码仓库中,与整个团队共享。

自动化处理重复性工作

通过 Codex 桌面端,你可以设置自动化(Automations),让 Codex 在后台按计划自动运行。自动化功能将指令与可选技能结合在一起,当任务完成时,结果会进入审查队列,方便你随时查看并继续跟进。

在 OpenAI,我们一直使用自动化来处理重要但重复的任务,例如每日 Issue 分类、查找并总结 CI 失败原因、生成每日发布简报以及检查 Bug 等。

适配你的工作风格

每位开发者与智能体协作的偏好都不尽相同。有些人喜欢直截了当、注重执行的伙伴;有些人则偏好更善于交流、富有共情能力的互动。

现在,Codex 允许开发者在两种性格之间进行选择:一种是简明务实的风格,另一种是对话式且富有共情的风格。两者的核心能力完全相同,只需在应用、CLI 或 IDE 扩展中使用 /personality 命令,即可切换到你最喜欢的交互方式。

默认安全与可配置沙盒

我们在整个 Codex 智能体技术栈中融入了“设计即安全”的理念。与 Codex CLI 一样,桌面端使用了原生的、开源的且可配置的系统级沙盒。

默认情况下,Codex 智能体仅限于在它们工作的文件夹或分支中编辑文件,并使用缓存的网络搜索。当需要执行涉及网络访问等高权限命令时,它会主动请求许可。你也可以为项目或团队配置规则,允许某些命令自动以高权限运行。

可用性与定价

Codex macOS 桌面端于今日正式上线。任何拥有 ChatGPT Plus、Pro、Business、Enterprise 或 Edu 订阅的用户,都可以使用其 ChatGPT 账号在 CLI、网页端、IDE 扩展和桌面端中使用 Codex。使用量已包含在 ChatGPT 订阅中,如有需要也可购买额外额度。

在有限时间内,Codex 也将向 ChatGPT Free 和 Go 用户开放。在此期间,所有付费计划的现有 Codex 用户的速率限制将翻倍。

未来展望

企业和开发者越来越依赖 Codex 进行端到端的开发。自 12 月中旬发布 GPT-5.2-Codex 以来,Codex 的整体使用量翻了一番;在过去一个月中,已有超过一百万开发者使用了 Codex。

我们将继续扩展 Codex 的使用场景和方式,包括推出 Windows 版本应用、突破模型能力的边界,以及提供更快的推理速度。在应用内部,我们将根据真实反馈不断优化多智能体工作流,让并行工作管理和上下文切换变得更加轻松。我们还在为自动化功能开发基于云端的触发器,这样 Codex 就可以在后台持续运行,而不仅限于电脑开启时。

Codex 的构建基于一个简单的理念:一切皆由代码控制。智能体在推理和生成代码方面越出色,它在所有形式的技术和知识工作中的能力就越强。Codex 旨在消除前沿模型能力与实际应用之间的鸿沟,让人们更容易指导、监督并将模型的全部智能应用于实际工作。我们期待看到你用 Codex 构建出令人惊叹的成果!

关联主题