GPT-5.2-Codex：最先进的智能体编程模型系统卡解析

摘要

1) 一句话总结 OpenAI于2025年12月18日发布了最先进的智能体编程模型GPT-5.2-Codex的系统卡，详细说明了其在复杂软件工程任务中的核心能力提升、双层安全防护机制以及备灾框架下的能力评估结果。

2) 关键要点

模型定位：于2025年12月18日发布，是基于GPT-5.2优化的智能体编程模型，专为应对复杂的现实世界软件工程设计。
长周期任务：采用上下文压缩（context compaction）技术，显著提升了处理长期工作的能力。
项目级表现：在代码重构和系统迁移等大型项目任务上展现出更强的性能。
环境与网络：改善了在Windows环境下的运行表现，并大幅增强了网络安全能力。
模型层安全：针对有害任务和提示词注入（prompt injections）进行了专门的安全训练。
产品层安全：引入了智能体沙盒（agent sandboxing）机制以及可配置的网络访问权限。
生物学评估：在生物学领域达到“高”能力级别，已配备GPT-5系列通用的安全防护套件进行部署。

3) 风险与不足

网络安全高风险临界：目前网络安全能力尚未达到“高”级别，但按当前能力增长趋势，预计在不久的将来会跨越这一高风险阈值。
生物学高风险：在生物学领域已被评估为具备“高”能力级别（目前依赖安全套件进行缓解）。
AI自我改进局限：模型在AI自我改进方面的能力尚未达到“高”级别。

正文

2025年12月18日，OpenAI 发布了 GPT-5.2-Codex 的系统卡补充说明。GPT-5.2-Codex 是迄今为止最先进的智能体编程模型（agentic coding model），专为应对复杂的现实世界软件工程而设计。作为 GPT-5.2 的优化版本，它在 Codex 环境中专门针对智能体编程进行了全面升级。

核心能力提升

该模型在多个关键领域实现了显著的改进：

长周期任务处理：通过上下文压缩（context compaction）技术，进一步提升了处理长期工作的能力。
项目级任务表现：在代码重构和系统迁移等大型项目任务上展现出更强的性能。
环境兼容性：改善了在 Windows 环境下的运行表现。
网络安全：网络安全能力得到了大幅增强。

全面的安全防护措施

为了确保安全，GPT-5.2-Codex 实施了全面的安全措施，涵盖模型与产品两个层面的风险缓解策略：

模型层面：针对有害任务和提示词注入（prompt injections）进行了专门的安全训练。
产品层面：引入了智能体沙盒（agent sandboxing）机制以及可配置的网络访问权限。

备灾框架评估结果

根据 OpenAI 的备灾框架（Preparedness Framework），对 GPT-5.2-Codex 的各项能力评估如下：

网络安全：模型在该领域能力非常强大，但目前尚未达到“高（High）”能力级别。不过，按照当前能力快速增长的趋势，预计模型在不久的将来就会跨越这一高风险阈值。
生物学：与其他近期的模型一样，它在生物学领域被视为具备“高”能力级别，并已配备了 GPT-5 系列模型通用的安全防护套件进行部署。
AI 自我改进：模型在 AI 自我改进方面尚未达到“高”能力级别。

wsl-docs

探索

GPT-5.2-Codex：最先进的智能体编程模型系统卡解析

摘要

正文

核心能力提升

全面的安全防护措施

备灾框架评估结果

相关文档

关联主题

关系图谱

目录

反向链接