摘要
1) 一句话总结 作者评测认为 Codex 类似于独立接单的“外包员工”,能够独立完成任务并交付验收,但目前仍是存在无法联网、时长受限等诸多限制的半成品,尚无法替代人类程序员。
2) 关键要点
- 工作模式:与需要结对编程的 Cursor(类似实习生)不同,Codex 像外包员工,接受任务后独立执行,用户只需进行最终验收,不合格可要求重做。
- 并发能力:用户可以同时拥有无数个这样的 Codex 智能体来并行处理任务。
- 交付机制:任务交付是“一锤子买卖”,用户只能全盘接受或全盘拒绝,无法进行二次修改。
- 状态隔离:每次任务相互独立(相当于每次换人),无法积累项目经验。
- 规范遵循:能够遵守项目中的文档规范(如 AGENTS.md)。
- 订阅建议:鉴于目前的功能限制,作者认为不值得专门为了 Codex 去订阅 Pro 会员。
- 未来展望:未来 Codex 类的 AI 智能体会让编程像 AI 画图一样通过写提示词“抽卡”,但这需要专业工程师或高智能 AI 提前做好任务的规划与拆分。
3) 风险与不足
- 网络限制:安装完虚拟机后无法联网,只能依赖现有项目代码和自身知识库修改代码。
- 时长限制:存在运行时长限制,时间一到就会停止工作。
- 容量限制:一次性能够处理的任务量有限。
- 能力差距:目前距离替代人类程序员(哪怕是初级程序员)还有不小的差距。
正文
说说我对 Codex 评测结果:
如果说 Cursor 是需要我们结对编程才能干活的实习生,那么 Codex 就是外包员工,任务甩过去就不用管了,完成后验收一下,不合格就让它重做一遍,直到满意为止。最关键是你可以拥有无数个这样的只需要验收的外包员工。
但目前 Codex 还只是半成品,有很多限制,比如安装完虚拟机后就不能联网了,有运行时长的限制,一次处理的任务有限,不值得专门为 Codex 去开 pro 会员订阅。
就好像这个外包公司员工的电脑不能联网,只能根据项目代码和自己的知识去修改代码,按照自己的理解去完成任务。外包任务是一锤子买卖,出来什么结果就是什么结果,你要么全盘接受,要么全盘拒绝,无法二次修改。这外包员工还比较懒,到时间了就不给你继续干了。 每一次任务都会换人,无法积累项目经验,但是会遵守文档规范(AGENTS.md)。
Codex 现在离替代程序员(哪怕初级)还有不小差距,不要期待太高。但未来 Codex 这样的 AI 智能体会让 AI 编程变得像 AI 画图,一个简单的任务,你只要写提示词不停的“抽卡”就好了,但前提是你要有专业的工程师或者高智能的 AI 帮你规划和拆分任务。
相关文档
- o1 之后,AI 已经从我的实习生变成了结对编程伙伴;关联理由:版本演进;说明:该文给出“实习生到结对伙伴”的协作阶段,本文进一步演进为“外包式并行验收”模式。
- AI 编程能力受限于上下文的限制,对于大型项目的构建能力偏弱该怎么办?;关联理由:解说;说明:该文提供了应对上下文窗口与任务容量限制的拆分方法,可直接补充本文提到的能力边界。
- AI 还没有改变软件工程范式;关联理由:观点一致;说明:两文都认为现阶段 AI 主要是提效工具而非完全替代人类工程师的范式颠覆者。