GPT-5.3-Codex 系统卡：迄今最强大的代理编程模型

摘要

1) 一句话总结 GPT-5.3-Codex 是迄今最强大的代理编程模型，它结合了高级编程与推理能力以支持复杂的长期任务，并针对生物学和网络安全领域部署了相应的安全防护机制。

2) 关键要点

3) 风险与缺口

GPT-5.3-Codex 是迄今为止最强大的代理编程模型（agentic coding model）。它将 GPT-5.2-Codex 的前沿编程性能与 GPT-5.2 的推理和专业知识能力完美结合。

这种结合使其能够胜任涉及研究、工具调用以及复杂执行的长期任务。在它工作时，你可以像对待人类同事一样对其进行引导并与之交互，且在此过程中完全不会丢失上下文。

在风险评估与部署方面，该模型在不同领域的表现及应对措施如下：

生物学领域：与近期推出的其他模型一样，GPT-5.3-Codex 在生物学领域被视为具备“高能力（High capability）”，并已配备 GPT-5 系列模型通用的安全防护套件进行部署。
AI 自我提升：该模型在 AI 自我提升（AI self-improvement）方面尚未达到“高能力”级别。
网络安全领域：根据我们的备灾框架（Preparedness Framework），这是首个在网络安全领域被视为具备“高能力”并启动相关安全防护的发布版本。

尽管目前没有确凿证据表明该模型已达到网络安全领域的“高能力”阈值，但我们无法排除其具备达到该阈值的可能性，因此我们采取了预防性的应对策略。

我们在网络安全领域的安全防护依赖于分层的安全堆栈（layered safety stack）。该机制的设计初衷是为了阻碍和破坏威胁行为者的恶意活动；与此同时，我们也在努力确保网络防御者能够尽可能便捷地获取并使用这些强大的模型能力。