Skip to content

Fast Mode:Opus 4.6 高速响应模式

Fast Mode 是 Opus 4.6 的高速配置,响应速度比标准模式快 2.5 倍,但 token 费用更高(输入 $30/MTok,输出 $150/MTok)。本质上不是换模型,而是同一个 Opus 4.6 换了优先速度的 API 配置——质量和能力完全相同。通过 /fast 命令切换开关,或在设置中持久启用。适合快速迭代、实时调试等对响应延迟敏感的场景。需要 Extra Usage 且不支持第三方云(Bedrock/Vertex/Foundry)。

Fast Mode 是 Opus 4.6 的高速配置,响应速度提升 2.5 倍,代价是更高的 token 费用。用 /fast 在需要速度时开启,不需要时关闭。

Fast Mode 不是换模型——使用的是同一个 Opus 4.6,只是换了优先速度而非成本效率的 API 配置。质量和能力完全相同,只是更快。

Fast Mode 是研究预览功能,功能、定价和可用性可能根据反馈调整。


切换 Fast Mode

两种方式:

命令切换:

/fast

再次运行 /fast 切换开/关。也可在 VS Code 扩展中通过 /fast 切换。

设置文件持久启用:

json
{
  "fastMode": true
}

开启后:

  • 如果当前不是 Opus 4.6,自动切换到 Opus 4.6
  • 出现确认消息:"Fast mode ON"
  • 提示符旁出现 图标

关闭 Fast Mode 后,你保留在 Opus 4.6 上,不会自动切回之前的模型。要切换模型,使用 /model


成本权衡

模式输入(每百万 token)输出(每百万 token)
Fast Mode Opus 4.6$30$150

Fast Mode 定价在整个 100 万 token 上下文窗口内统一计算。

重要:如果在会话中途开启 Fast Mode,整个已有上下文都会按 Fast Mode 未缓存的输入 token 价格重新计费——比从会话开始就启用要贵得多。建议在会话开始时就决定是否使用 Fast Mode,不要中途切换。


什么时候用 Fast Mode

适合:

  • 快速迭代代码变更
  • 实时 debug 会话
  • 时间紧迫的高压工作

不适合:

  • 长时间自主运行的任务(速度不是首要考虑)
  • CI/CD 批处理
  • 注重成本控制的工作

Fast Mode vs 降低推理力度

设置效果
Fast Mode相同质量,更低延迟,更高费用
低推理力度/effort low减少思考时间,更快但复杂任务质量可能下降

两者可以组合:Fast Mode + 低推理力度 = 极致速度,适合不需要深度思考的简单任务。


使用要求

Fast Mode 需要同时满足以下条件:

  1. 不支持第三方云:不可用于 Amazon Bedrock、Google Vertex AI 或 Microsoft Azure Foundry。仅支持 Anthropic Console API 和订阅计划(Pro/Max/Team/Enterprise)的 Extra Usage。

  2. 需要启用 Extra Usage:允许超出套餐用量后继续计费

    • 个人账号:在 Console 账单设置 中开启
    • Team/Enterprise:管理员需为组织开启 Extra Usage
  3. Team/Enterprise 还需管理员额外开启(默认关闭):

完全禁用 Fast Mode:设置环境变量 CLAUDE_CODE_DISABLE_FAST_MODE=1,详见环境变量


企业管理:要求每次会话手动开启

默认情况下,Fast Mode 跨会话持久保存。Team/Enterprise 管理员可以阻止这种行为,让每次会话都从关闭状态开始,要求用户显式开启:

json
{
  "fastModePerSessionOptIn": true
}

托管设置server-managed settings 中配置。用户仍可通过 /fast 在需要时开启,但每次新会话都会重置,有助于控制多会话并发时的费用。

移除此设置后,用户的 Fast Mode 偏好恢复持久保存的默认行为。


触发限流后的自动回退

Fast Mode 有独立的速率限制。触发限流或 Extra Usage 耗尽后:

  1. 自动回退到标准 Opus 4.6
  2. 图标变灰,表示冷却中
  3. 继续以标准速度和费率工作
  4. 冷却期结束后,Fast Mode 自动重新开启

不想等冷却?再次运行 /fast 手动关闭。


相关文档

常见问题

Q: Fast Mode 开启后,模型质量会变吗?

不会。Fast Mode 使用的是同一个 Opus 4.6,只是 API 配置不同——优先速度而非成本效率。质量和能力与标准模式完全相同。

Q: 为什么不建议在会话中途开启 Fast Mode?

因为开启时,已有的整个上下文会按 Fast Mode 未缓存的输入价格重新计费,比从会话开始就启用要贵得多。建议在会话开始前就决定是否需要速度优先。

Q: Fast Mode 触发限流后可以继续使用 Claude Code 吗?

可以。触发限流后会自动回退到标准 Opus 4.6 继续工作, 图标变灰表示冷却中。冷却结束后 Fast Mode 自动恢复。