Skip to content

Fast Mode:给 Opus 4.6 装上涡轮增压

Fast Mode 目前是"研究预览版",功能、定价和可用性可能根据反馈调整。 需要 Claude Code v2.1.36 或更高版本(claude --version 查看)。

在激烈的 debug 会话、快速原型迭代、赶 deadline 的实时编码中,等待 Claude 响应的每一秒都很煎熬?Fast Mode 让 Opus 4.6 响应速度提升 2.5 倍

Fast Mode 是什么?

Fast Mode 不是换了一个模型。它是同一个 Opus 4.6,换了一种优先速度而非成本效率的 API 配置。质量和能力完全相同,只是更快,代价是 token 费用更高。

如何开启

方法一:命令切换

text
/fast

再次运行 /fast 可以切换开/关。

方法二:配置文件持久开启

json
{
  "fastMode": true
}

开启 Fast Mode 后:

  • 如果你当前用的不是 Opus 4.6,会自动切换到 Opus 4.6
  • 出现确认消息:"Fast mode ON"
  • 提示符旁边出现小图标

关闭 Fast Mode(再次运行 /fast)后,你会停留在 Opus 4.6,不会自动切回之前的模型。要换其他模型,用 /model 命令。

成本权衡

模式输入(每百万 token)输出(每百万 token)
Fast Mode Opus 4.6$30$150

重要提醒:如果在会话中途开启 Fast Mode,整个已有的上下文都会按 Fast Mode 未缓存的输入价格重新计费——比从会话开始就开启要贵。建议在会话一开始就决定是否用 Fast Mode

Fast Mode 用量计入 Extra Usage(额外用量),不占用订阅套餐内的用量配额,直接按 Fast Mode 费率从第一个 token 开始计费。

什么时候用 Fast Mode?

适合用 Fast Mode 的场景:

  • 快速迭代代码改动
  • 实时 debug 会话
  • 时间紧的高压工作

不适合 Fast Mode 的场景:

  • 长时间自主运行的任务(速度不是首要考虑)
  • CI/CD 流水线批处理
  • 注重成本控制的工作

Fast Mode vs 降低推理力度

两者都能加速响应,但方式不同:

设置效果
Fast Mode同等质量,更低延迟,更高费用
低推理力度(/effort low减少思考时间,更快但复杂任务质量可能下降

两者可以组合:Fast Mode + 低力度 = 极致速度(适合不需要深度思考的简单任务)。

使用要求

Fast Mode 需要同时满足以下条件:

  1. 不能是第三方云:不支持 Amazon Bedrock、Google Vertex AI、Microsoft Azure Foundry。仅支持 Anthropic Console API 和 claude.ai 订阅计划。

  2. 需要开启 Extra Usage

    • 个人账号:在 Console 账单设置 中开启
    • Team/Enterprise:管理员需要为组织开启 Extra Usage
  3. Team/Enterprise 还需要管理员额外开启 Fast Mode(默认关闭):

完全禁用 Fast Mode:CLAUDE_CODE_DISABLE_FAST_MODE=1

企业管理:强制每次会话手动开启

默认情况下,Fast Mode 设置跨会话持久保存。Team/Enterprise 管理员可以禁止这种行为,强制每次会话都需要手动开启:

json
{
  "fastModePerSessionOptIn": true
}

managed settingsserver-managed settings 中设置。这样每个新会话都从关闭状态开始,用户需要手动 /fast 开启,有助于控制多会话并发时的费用。

触发限流后的自动回退

Fast Mode 有独立的速率限制。触发后:

  1. 自动回退到标准 Opus 4.6
  2. 图标变灰,表示冷却中
  3. 继续以标准速度和费率工作
  4. 冷却结束后,Fast Mode 自动重新开启

不想等冷却?再次运行 /fast 手动关闭。


相关文档