摘要
1) 一句话总结 OpenAI于2025年12月18日发布了最先进的智能体编程模型GPT-5.2-Codex的系统卡,详细说明了其在复杂软件工程任务中的核心能力提升、双层安全防护机制以及备灾框架下的能力评估结果。
2) 关键要点
- 模型定位:于2025年12月18日发布,是基于GPT-5.2优化的智能体编程模型,专为应对复杂的现实世界软件工程设计。
- 长周期任务:采用上下文压缩(context compaction)技术,显著提升了处理长期工作的能力。
- 项目级表现:在代码重构和系统迁移等大型项目任务上展现出更强的性能。
- 环境与网络:改善了在Windows环境下的运行表现,并大幅增强了网络安全能力。
- 模型层安全:针对有害任务和提示词注入(prompt injections)进行了专门的安全训练。
- 产品层安全:引入了智能体沙盒(agent sandboxing)机制以及可配置的网络访问权限。
- 生物学评估:在生物学领域达到“高”能力级别,已配备GPT-5系列通用的安全防护套件进行部署。
3) 风险与不足
- 网络安全高风险临界:目前网络安全能力尚未达到“高”级别,但按当前能力增长趋势,预计在不久的将来会跨越这一高风险阈值。
- 生物学高风险:在生物学领域已被评估为具备“高”能力级别(目前依赖安全套件进行缓解)。
- AI自我改进局限:模型在AI自我改进方面的能力尚未达到“高”级别。
正文
2025年12月18日,OpenAI 发布了 GPT-5.2-Codex 的系统卡补充说明。GPT-5.2-Codex 是迄今为止最先进的智能体编程模型(agentic coding model),专为应对复杂的现实世界软件工程而设计。作为 GPT-5.2 的优化版本,它在 Codex 环境中专门针对智能体编程进行了全面升级。
核心能力提升
该模型在多个关键领域实现了显著的改进:
- 长周期任务处理:通过上下文压缩(context compaction)技术,进一步提升了处理长期工作的能力。
- 项目级任务表现:在代码重构和系统迁移等大型项目任务上展现出更强的性能。
- 环境兼容性:改善了在 Windows 环境下的运行表现。
- 网络安全:网络安全能力得到了大幅增强。
全面的安全防护措施
为了确保安全,GPT-5.2-Codex 实施了全面的安全措施,涵盖模型与产品两个层面的风险缓解策略:
- 模型层面:针对有害任务和提示词注入(prompt injections)进行了专门的安全训练。
- 产品层面:引入了智能体沙盒(agent sandboxing)机制以及可配置的网络访问权限。
备灾框架评估结果
根据 OpenAI 的备灾框架(Preparedness Framework),对 GPT-5.2-Codex 的各项能力评估如下:
- 网络安全:模型在该领域能力非常强大,但目前尚未达到“高(High)”能力级别。不过,按照当前能力快速增长的趋势,预计模型在不久的将来就会跨越这一高风险阈值。
- 生物学:与其他近期的模型一样,它在生物学领域被视为具备“高”能力级别,并已配备了 GPT-5 系列模型通用的安全防护套件进行部署。
- AI 自我改进:模型在 AI 自我改进方面尚未达到“高”能力级别。
相关文档
- OpenAI 发布 GPT-5.1-Codex-Max 系统卡;关联理由:版本演进;说明:同属 Codex 系统卡,可对比 5.1 与 5.2 在能力与安全缓解上的变化。
- GPT-5.3-Codex 系统卡:迄今最强大的代理编程模型;关联理由:版本演进;说明:同属 Codex 系统卡,可对比 5.2 与 5.3 在能力边界与网络安全分级上的演进。
- OpenAI 的人工智能安全策略;关联理由:解说;说明:该文提供组织级安全框架背景,可解释本系统卡中的风险分级与缓解措施。