OpenAI Codex 在高风险网络安全请求下可能触发安全缓解,把流量重定向到 GPT-5.2,以减少明显恶意请求带来的风险。若你做的是合法安全研究或防御工作,可以通过 chatgpt.com/cyber 申请 Trusted Access;误判时,CLI 和 API 日志会显示实际响应模型,也可以用 /feedback 报告 false positive。
OpenAI Codex 网络安全限制与误判排查
GPT-5.3-Codex 是 OpenAI 在 Preparedness Framework 下按 High cybersecurity capability 处理的第一个模型,因此会附加额外安全保障。对于明显恶意的请求,例如窃取凭据,模型会直接拒绝。
除了训练层面的拒绝能力,系统还会用自动分类器监测可疑网络安全活动;当判定流量风险较高时,系统会把请求重定向到能力较低的 GPT-5.2。受影响的流量预计只占很小一部分,OpenAI 也在持续调整策略、分类器和产品内提示。
为什么 OpenAI Codex 会这样处理网络安全请求
近几个月,模型在网络安全任务上的表现提升很明显,这既帮助开发者,也帮助安全人员。随着模型在漏洞发现等任务上更强,OpenAI 采取的是更谨慎的方式:扩展保护和执行力度,一边支持正当研究,一边降低滥用风险。
网络安全能力天然具有双重用途。渗透测试、漏洞研究、大规模扫描、恶意软件分析、威胁情报这些能力,既能支持重要防御工作,也可能被用于现实伤害。
如果你需要在高风险网络安全场景中继续使用模型,OpenAI 提供了 Trusted Access for Cyber 试点,目的是让个人和组织在不受干扰的情况下继续开展相关工作。
OpenAI Codex 的安全降级是怎么工作的
做网络安全相关工作,或者做一些自动检测系统可能会误判的类似活动时,请求可能会被回退到 GPT-5.2。
- OpenAI 预计只有很少一部分流量会受到这些缓解措施影响。
- OpenAI 还在继续校准策略和分类器。
- 最新的 alpha 版 Codex CLI 已经会在请求被重定向时显示产品内提示。
- 这个提示会在接下来几天支持所有客户端。
如果账号受到缓解措施影响,可以通过加入下方的 Trusted Access 计划恢复对 GPT-5.3-Codex 的访问。
OpenAI 也说明,随着这些缓解措施扩展,大多数情况下会从账号级安全检查逐步转向请求级检查。
Trusted Access for Cyber
OpenAI 正在试点 trusted access,用来让开发者在 OpenAI 继续校准面向公开可用场景的策略和分类器时,保留更强的能力。目标是让需要加入 Trusted Access for Cyber 的用户尽可能少。
要在潜在高风险的网络安全工作中使用模型:
- 用户可以在 chatgpt.com/cyber 验证身份。
- 企业可以通过自己的 OpenAI 代表,为整个团队默认申请 trusted access。
如果你是安全研究员,或者团队需要更强、更宽松的网络安全模型来加速正当防御工作,还可以表达加入仅邀请制项目的意向:invite-only program。
即使获得 trusted access,用户仍然必须遵守 Usage Policies 和 Terms of Use。
误判
合法的、或者并非网络安全相关的活动,有时也可能被误标。
当发生重定向时,响应模型会在 API request logs 中显示;在 CLI 中也会显示产品内通知,其他界面也会陆续支持。如果你认为自己遇到的是错误重定向,可以通过 /feedback 报告 false positive。
常见问题
OpenAI Codex 为什么会被重定向到 GPT-5.2
当请求被系统判断为高风险网络安全活动,或者被自动检测系统误判时,Codex 可能会被重定向到 GPT-5.2。OpenAI 预计只有很少一部分流量会受影响,但仍在持续调整策略和分类器。
我怎么恢复 OpenAI Codex 的 GPT-5.3-Codex 访问
如果账号受到缓解措施影响,可以加入 Trusted Access for Cyber 计划。个人用户可以在 chatgpt.com/cyber 验证身份;企业则可以通过 OpenAI 代表申请团队级 trusted access。
误判后怎么反馈
如果你认为重定向不正确,可以通过 /feedback 提交 false positive。API request logs 和 CLI 的产品内通知会显示实际使用的响应模型,便于你核对。