Fast Mode：Opus 4.6 高速响应模式

Fast Mode 是 Opus 4.6 的高速配置，响应速度比标准模式快 2.5 倍，但 token 费用更高（输入 $30/MTok，输出 $150/MTok）。本质上不是换模型，而是同一个 Opus 4.6 换了优先速度的 API 配置——质量和能力完全相同。通过 /fast 命令切换开关，或在设置中持久启用。适合快速迭代、实时调试等对响应延迟敏感的场景。需要 Extra Usage 且不支持第三方云（Bedrock/Vertex/Foundry）。

Fast Mode 是 Opus 4.6 的高速配置，响应速度提升 2.5 倍，代价是更高的 token 费用。用 /fast 在需要速度时开启，不需要时关闭。

Fast Mode 不是换模型——使用的是同一个 Opus 4.6，只是换了优先速度而非成本效率的 API 配置。质量和能力完全相同，只是更快。

Fast Mode 是研究预览功能，功能、定价和可用性可能根据反馈调整。

切换 Fast Mode

两种方式：

命令切换：

/fast

再次运行 /fast 切换开/关。也可在 VS Code 扩展中通过 /fast 切换。

设置文件持久启用：

json

{
  "fastMode": true
}

开启后：

如果当前不是 Opus 4.6，自动切换到 Opus 4.6
出现确认消息："Fast mode ON"
提示符旁出现 ↯ 图标

关闭 Fast Mode 后，你保留在 Opus 4.6 上，不会自动切回之前的模型。要切换模型，使用 /model。

成本权衡

模式	输入（每百万 token）	输出（每百万 token）
Fast Mode Opus 4.6	$30	$150

Fast Mode 定价在整个 100 万 token 上下文窗口内统一计算。

重要：如果在会话中途开启 Fast Mode，整个已有上下文都会按 Fast Mode 未缓存的输入 token 价格重新计费——比从会话开始就启用要贵得多。建议在会话开始时就决定是否使用 Fast Mode，不要中途切换。

什么时候用 Fast Mode

适合：

快速迭代代码变更
实时 debug 会话
时间紧迫的高压工作

不适合：

长时间自主运行的任务（速度不是首要考虑）
CI/CD 批处理
注重成本控制的工作

Fast Mode vs 降低推理力度

设置	效果
Fast Mode	相同质量，更低延迟，更高费用
低推理力度（`/effort low`）	减少思考时间，更快但复杂任务质量可能下降

两者可以组合：Fast Mode + 低推理力度 = 极致速度，适合不需要深度思考的简单任务。

使用要求

Fast Mode 需要同时满足以下条件：

不支持第三方云：不可用于 Amazon Bedrock、Google Vertex AI 或 Microsoft Azure Foundry。仅支持 Anthropic Console API 和订阅计划（Pro/Max/Team/Enterprise）的 Extra Usage。
需要启用 Extra Usage：允许超出套餐用量后继续计费
- 个人账号：在 Console 账单设置中开启
- Team/Enterprise：管理员需为组织开启 Extra Usage
Team/Enterprise 还需管理员额外开启（默认关闭）：
- Console（API 用户）：在 Claude Code preferences 开启
- Claude AI（Team/Enterprise）：在 Admin Settings > Claude Code 开启

完全禁用 Fast Mode：设置环境变量 CLAUDE_CODE_DISABLE_FAST_MODE=1，详见环境变量。

企业管理：要求每次会话手动开启

默认情况下，Fast Mode 跨会话持久保存。Team/Enterprise 管理员可以阻止这种行为，让每次会话都从关闭状态开始，要求用户显式开启：

json

{
  "fastModePerSessionOptIn": true
}

在托管设置或 server-managed settings 中配置。用户仍可通过 /fast 在需要时开启，但每次新会话都会重置，有助于控制多会话并发时的费用。

移除此设置后，用户的 Fast Mode 偏好恢复持久保存的默认行为。

触发限流后的自动回退

Fast Mode 有独立的速率限制。触发限流或 Extra Usage 耗尽后：

自动回退到标准 Opus 4.6
↯ 图标变灰，表示冷却中
继续以标准速度和费率工作
冷却期结束后，Fast Mode 自动重新开启

不想等冷却？再次运行 /fast 手动关闭。

常见问题

Q: Fast Mode 开启后，模型质量会变吗？

不会。Fast Mode 使用的是同一个 Opus 4.6，只是 API 配置不同——优先速度而非成本效率。质量和能力与标准模式完全相同。

Q: 为什么不建议在会话中途开启 Fast Mode？

因为开启时，已有的整个上下文会按 Fast Mode 未缓存的输入价格重新计费，比从会话开始就启用要贵得多。建议在会话开始前就决定是否需要速度优先。

Q: Fast Mode 触发限流后可以继续使用 Claude Code 吗？

可以。触发限流后会自动回退到标准 Opus 4.6 继续工作，↯ 图标变灰表示冷却中。冷却结束后 Fast Mode 自动恢复。

Fast Mode：Opus 4.6 高速响应模式 ​

切换 Fast Mode ​

成本权衡 ​

什么时候用 Fast Mode ​

Fast Mode vs 降低推理力度 ​

使用要求 ​

企业管理：要求每次会话手动开启 ​

触发限流后的自动回退 ​

相关文档 ​

常见问题 ​