摘要

1) 一句话总结 OpenAI于2025年12月18日发布了最先进的智能体编程模型GPT-5.2-Codex的系统卡,详细说明了其在复杂软件工程任务中的核心能力提升、双层安全防护机制以及备灾框架下的能力评估结果。

2) 关键要点

  • 模型定位:于2025年12月18日发布,是基于GPT-5.2优化的智能体编程模型,专为应对复杂的现实世界软件工程设计。
  • 长周期任务:采用上下文压缩(context compaction)技术,显著提升了处理长期工作的能力。
  • 项目级表现:在代码重构和系统迁移等大型项目任务上展现出更强的性能。
  • 环境与网络:改善了在Windows环境下的运行表现,并大幅增强了网络安全能力。
  • 模型层安全:针对有害任务和提示词注入(prompt injections)进行了专门的安全训练。
  • 产品层安全:引入了智能体沙盒(agent sandboxing)机制以及可配置的网络访问权限。
  • 生物学评估:在生物学领域达到“高”能力级别,已配备GPT-5系列通用的安全防护套件进行部署。

3) 风险与不足

  • 网络安全高风险临界:目前网络安全能力尚未达到“高”级别,但按当前能力增长趋势,预计在不久的将来会跨越这一高风险阈值。
  • 生物学高风险:在生物学领域已被评估为具备“高”能力级别(目前依赖安全套件进行缓解)。
  • AI自我改进局限:模型在AI自我改进方面的能力尚未达到“高”级别。

正文

2025年12月18日,OpenAI 发布了 GPT-5.2-Codex 的系统卡补充说明。GPT-5.2-Codex 是迄今为止最先进的智能体编程模型(agentic coding model),专为应对复杂的现实世界软件工程而设计。作为 GPT-5.2 的优化版本,它在 Codex 环境中专门针对智能体编程进行了全面升级。

核心能力提升

该模型在多个关键领域实现了显著的改进:

  • 长周期任务处理:通过上下文压缩(context compaction)技术,进一步提升了处理长期工作的能力。
  • 项目级任务表现:在代码重构和系统迁移等大型项目任务上展现出更强的性能。
  • 环境兼容性:改善了在 Windows 环境下的运行表现。
  • 网络安全:网络安全能力得到了大幅增强。

全面的安全防护措施

为了确保安全,GPT-5.2-Codex 实施了全面的安全措施,涵盖模型与产品两个层面的风险缓解策略:

  • 模型层面:针对有害任务和提示词注入(prompt injections)进行了专门的安全训练。
  • 产品层面:引入了智能体沙盒(agent sandboxing)机制以及可配置的网络访问权限。

备灾框架评估结果

根据 OpenAI 的备灾框架(Preparedness Framework),对 GPT-5.2-Codex 的各项能力评估如下:

  • 网络安全:模型在该领域能力非常强大,但目前尚未达到“高(High)”能力级别。不过,按照当前能力快速增长的趋势,预计模型在不久的将来就会跨越这一高风险阈值。
  • 生物学:与其他近期的模型一样,它在生物学领域被视为具备“高”能力级别,并已配备了 GPT-5 系列模型通用的安全防护套件进行部署。
  • AI 自我改进:模型在 AI 自我改进方面尚未达到“高”能力级别。

相关文档

关联主题