Cyber Safety 网络安全

Codex 的网络安全保障与可信访问机制

Codex 用户的网络安全保障与可信访问

GPT-5.3-Codex 是我们根据《准备框架》（Preparedness Framework）认定为 高网络安全能力 的首个模型，这需要额外的安全保障。这些保障包括训练模型拒绝明显的恶意请求，如窃取凭据。

除了安全训练外，基于自动分类器的监控系统能够检测可疑网络活动的信号，并将高风险流量路由到网络能力较低的模型（GPT-5.2）。预计只有极小部分的流量会受到这些缓解措施的影响，我们正在努力优化策略、分类器和产品内通知。

为什么要这样做

近几个月来，我们在网络安全任务上的模型性能取得了显著提升，这对开发者和安全专业人员都有益。随着我们的模型在漏洞发现等网络安全相关任务上的能力提升，我们正采取预防性方法：在支持合法研究的同时，扩大保护措施和执法力度，以减缓滥用行为。

网络安全能力本质上是双用途的。支撑重要防御工作（渗透测试、漏洞研究、大规模扫描、恶意软件分析和威胁情报）的相同知识和技术，也可能被用于造成实际伤害。

这些能力和技术需要在能够用于改善安全的场景中更容易获得和使用。我们的 Trusted Access for Cyber（网络安全可信访问） 试点项目使得个人和组织能够继续使用模型进行潜在高风险网络安全活动而不受干扰。

从事网络安全相关工作或可能被自动检测系统误判的类似活动的开发者和安全专业人员，其请求可能会被重新路由到 GPT-5.2 作为回退。预计只有极小部分流量会受到缓解措施的影响，我们正在积极校准策略和分类器。

受到缓解措施影响的账户可以通过加入下面的 Trusted Access 计划来恢复对 GPT-5.3-Codex 的访问。

我们认识到加入 Trusted Access 可能不适合所有人，因此我们计划随着缓解措施的扩展和网络弹性的增强，在大多数情况下从账户级安全检查转向请求级检查。

我们正在试点”可信访问”机制，使开发者能够保留高级能力，同时我们继续校准策略和分类器以进行普遍发布。我们的目标是只有极少数用户需要加入 Trusted Access for Cyber。

要使用模型进行潜在高风险的网络安全工作：

安全研究人员和团队（可能需要访问更高网络安全能力或更宽松的模型以加速合法防御工作）可以表达加入 仅限邀请计划 的兴趣。拥有可信访问的用户仍必须遵守我们的使用政策和服务条款。

合法的或非网络安全的 activity 偶尔可能被标记。当重新路由发生时，响应的模型将在 API 请求日志中可见，并在 CLI 中显示产品内通知，未来将在所有界面中支持。如果你遇到你认为不正确的重新路由，请通过 /feedback 报告误报。