摘要
1) 一句话总结 GPT-5.3-Codex 是迄今最强大的代理编程模型,它结合了高级编程与推理能力以支持复杂的长期任务,并针对生物学和网络安全领域部署了相应的安全防护机制。
2) 关键要点
- 能力融合:结合了 GPT-5.2-Codex 的前沿编程性能与 GPT-5.2 的推理和专业知识能力。
- 长期任务执行:能够胜任涉及研究、工具调用以及复杂执行的长期任务。
- 无缝交互:支持在完全不丢失上下文的情况下,与人类进行类似同事般的引导与交互。
- 生物学领域评估:被评估为具备“高能力(High capability)”,已配备 GPT-5 系列通用的安全防护套件进行部署。
- AI 自我提升评估:在该领域尚未达到“高能力”级别。
- 网络安全领域评估:根据备灾框架(Preparedness Framework),这是首个在网络安全领域被视为具备“高能力”并启动相关防护的发布版本。
- 防御机制:采用分层安全堆栈(layered safety stack),旨在阻碍恶意活动,同时确保网络防御者能便捷地使用模型能力。
3) 风险与缺口
- 网络安全能力不确定性:虽然目前无确凿证据,但无法完全排除该模型已达到网络安全领域“高能力”阈值的可能性(已据此采取预防性措施)。
- 恶意利用风险:存在威胁行为者(threat actors)利用该模型进行恶意活动的风险(已通过分层安全堆栈进行阻碍和破坏)。
正文
迄今最强大的代理编程模型
GPT-5.3-Codex 是迄今为止最强大的代理编程模型(agentic coding model)。它将 GPT-5.2-Codex 的前沿编程性能与 GPT-5.2 的推理和专业知识能力完美结合。
这种结合使其能够胜任涉及研究、工具调用以及复杂执行的长期任务。在它工作时,你可以像对待人类同事一样对其进行引导并与之交互,且在此过程中完全不会丢失上下文。
风险评估与安全防护
在风险评估与部署方面,该模型在不同领域的表现及应对措施如下:
- 生物学领域:与近期推出的其他模型一样,GPT-5.3-Codex 在生物学领域被视为具备“高能力(High capability)”,并已配备 GPT-5 系列模型通用的安全防护套件进行部署。
- AI 自我提升:该模型在 AI 自我提升(AI self-improvement)方面尚未达到“高能力”级别。
- 网络安全领域:根据我们的备灾框架(Preparedness Framework),这是首个在网络安全领域被视为具备“高能力”并启动相关安全防护的发布版本。
针对网络安全的预防性措施
尽管目前没有确凿证据表明该模型已达到网络安全领域的“高能力”阈值,但我们无法排除其具备达到该阈值的可能性,因此我们采取了预防性的应对策略。
我们在网络安全领域的安全防护依赖于分层的安全堆栈(layered safety stack)。该机制的设计初衷是为了阻碍和破坏威胁行为者的恶意活动;与此同时,我们也在努力确保网络防御者能够尽可能便捷地获取并使用这些强大的模型能力。
相关文档
- 介绍 GPT-5.3-Codex:迄今最强大的智能体编程模型;关联理由:同一事件;说明:该文是同一模型发布的主公告,系统卡可作为其安全与能力边界的技术补充。
- 推出 GPT-5.3-Codex-Spark:专为实时编程打造的超快模型;关联理由:版本演进;说明:Spark 是 GPT-5.3-Codex 的轻量化实时分支,体现同系列模型在场景与能力上的分化。
- 推出网络安全可信访问计划;关联理由:上下游;说明:该文展开系统卡提及的可信访问与滥用防护策略,属于高能力网络安全部署的后续落地方案。