摘要
1) 一句话总结 OpenAI 于2025年11月19日发布了前沿代理编程模型 GPT-5.1-Codex-Max 的系统卡,详细披露了其首创的上下文压缩技术、真实场景训练细节以及基于备灾框架的全面安全评估结果。
2) 关键要点
- 模型定位:GPT-5.1-Codex-Max 是一款基于更新后的基础推理模型构建的全新前沿代理编程模型。
- 适用领域:专门针对软件工程、数学、研究、医学以及计算机操作等领域的代理任务进行训练。
- 上下文压缩技术:首个原生支持通过“压缩(compaction)”过程在多个上下文窗口中运行的模型,能够在单一任务中连贯处理数百万个 Token。
- 真实场景训练:模型在拉取请求(PR)创建、代码审查、前端编程及问答等真实软件工程任务中完成了训练。
- 模型层安全:针对有害任务和提示词注入(prompt injections)进行了专门的安全训练。
- 产品层安全:实施了代理沙盒(agent sandboxing)以及可配置的网络访问控制等缓解措施。
- 生物学能力评级:在备灾框架评估中,生物学领域被评为“高”能力,已配备与 GPT-5 相同的配套安全防护措施。
- 其他能力评级:目前在网络安全和 AI 自我改进方面的能力尚未达到“高”阈值。
3) 风险与不足
- 网络安全风险演进:虽然当前网络安全能力未达到“高”阈值,但按其能力快速增长的趋势,预计在不久的将来会跨越该高风险阈值。
- 生物学高风险:模型在生物学领域已具备“高”能力风险(已通过部署配套防护措施进行缓解)。
- 提示词注入与有害任务:模型面临执行有害任务及遭受提示词注入的风险(已通过模型层面的专门训练进行缓解)。
正文
2025年11月19日,OpenAI 发布了 GPT-5.1-Codex-Max 的系统卡。这是一款全新的前沿代理编程模型(frontier agentic coding model)。
核心能力与技术突破
GPT-5.1-Codex-Max 基于更新后的基础推理模型构建,针对软件工程、数学、研究、医学以及计算机操作等领域的代理任务进行了专门训练。
- 上下文压缩技术: 这是首个通过“压缩(compaction)”过程,原生支持在多个上下文窗口中运行的模型。它能够在单一任务中连贯地处理数百万个 Token。
- 真实场景训练: 与其前代产品一样,该模型在真实的软件工程任务中进行了训练,涵盖拉取请求(PR)创建、代码审查、前端编程以及问答等场景。
全面的安全与缓解措施
系统卡详细介绍了为 GPT-5.1-Codex-Max 实施的全面安全措施,主要涵盖模型与产品两个层面:
- 模型层面: 针对有害任务和提示词注入(prompt injections)进行了专门的安全训练。
- 产品层面: 实施了代理沙盒(agent sandboxing)以及可配置的网络访问控制等缓解措施。
备灾框架评估结果
根据 OpenAI 的备灾框架(Preparedness Framework),GPT-5.1-Codex-Max 接受了严格的评估,其各项能力风险评级如下:
- 网络安全: 该模型在网络安全领域具备极强的能力,但尚未达到“高(High)”能力阈值。不过按照当前能力快速增长的趋势,预计模型在不久的将来就会跨越这一阈值。
- 生物学: 与近期发布的其他模型一样,该模型在生物学领域被视为具备“高”能力,因此在部署时配备了与 GPT-5 相同的配套安全防护措施。
- AI 自我改进: 该模型在 AI 自我改进方面尚未达到“高”能力级别。
相关文档
- 深入解析 GPT-5 系统卡片:全新模型架构与核心能力;关联理由:版本演进;说明:本文基于 GPT-5.1-Codex-Max 展开,GPT-5 系统卡可作为其基础能力与安全评估框架的上游背景。
- GPT-5.2-Codex:最先进的智能体编程模型系统卡解析;关联理由:版本演进;说明:同属 Codex 系统卡,可直接对照 5.1 与 5.2 在长周期任务能力和风险缓解措施上的变化。
- OpenAI 的人工智能安全策略;关联理由:解说;说明:该文提供组织级安全治理与风险分级语境,可解释本系统卡中的备灾框架与部署防护边界。