Appearance
Fast Mode:给 Opus 4.6 装上涡轮增压
Fast Mode 目前是"研究预览版",功能、定价和可用性可能根据反馈调整。 需要 Claude Code v2.1.36 或更高版本(
claude --version查看)。
在激烈的 debug 会话、快速原型迭代、赶 deadline 的实时编码中,等待 Claude 响应的每一秒都很煎熬?Fast Mode 让 Opus 4.6 响应速度提升 2.5 倍。
Fast Mode 是什么?
Fast Mode 不是换了一个模型。它是同一个 Opus 4.6,换了一种优先速度而非成本效率的 API 配置。质量和能力完全相同,只是更快,代价是 token 费用更高。
如何开启
方法一:命令切换
text
/fast再次运行 /fast 可以切换开/关。
方法二:配置文件持久开启
json
{
"fastMode": true
}开启 Fast Mode 后:
- 如果你当前用的不是 Opus 4.6,会自动切换到 Opus 4.6
- 出现确认消息:"Fast mode ON"
- 提示符旁边出现小图标
↯
关闭 Fast Mode(再次运行 /fast)后,你会停留在 Opus 4.6,不会自动切回之前的模型。要换其他模型,用 /model 命令。
成本权衡
| 模式 | 输入(每百万 token) | 输出(每百万 token) |
|---|---|---|
| Fast Mode Opus 4.6 | $30 | $150 |
重要提醒:如果在会话中途开启 Fast Mode,整个已有的上下文都会按 Fast Mode 未缓存的输入价格重新计费——比从会话开始就开启要贵。建议在会话一开始就决定是否用 Fast Mode。
Fast Mode 用量计入 Extra Usage(额外用量),不占用订阅套餐内的用量配额,直接按 Fast Mode 费率从第一个 token 开始计费。
什么时候用 Fast Mode?
适合用 Fast Mode 的场景:
- 快速迭代代码改动
- 实时 debug 会话
- 时间紧的高压工作
不适合 Fast Mode 的场景:
- 长时间自主运行的任务(速度不是首要考虑)
- CI/CD 流水线批处理
- 注重成本控制的工作
Fast Mode vs 降低推理力度
两者都能加速响应,但方式不同:
| 设置 | 效果 |
|---|---|
| Fast Mode | 同等质量,更低延迟,更高费用 |
低推理力度(/effort low) | 减少思考时间,更快但复杂任务质量可能下降 |
两者可以组合:Fast Mode + 低力度 = 极致速度(适合不需要深度思考的简单任务)。
使用要求
Fast Mode 需要同时满足以下条件:
不能是第三方云:不支持 Amazon Bedrock、Google Vertex AI、Microsoft Azure Foundry。仅支持 Anthropic Console API 和 claude.ai 订阅计划。
需要开启 Extra Usage:
- 个人账号:在 Console 账单设置 中开启
- Team/Enterprise:管理员需要为组织开启 Extra Usage
Team/Enterprise 还需要管理员额外开启 Fast Mode(默认关闭):
- Console(API 用户):在 Claude Code preferences 开启
- Claude AI(Team/Enterprise):在 Admin Settings > Claude Code 开启
完全禁用 Fast Mode:CLAUDE_CODE_DISABLE_FAST_MODE=1
企业管理:强制每次会话手动开启
默认情况下,Fast Mode 设置跨会话持久保存。Team/Enterprise 管理员可以禁止这种行为,强制每次会话都需要手动开启:
json
{
"fastModePerSessionOptIn": true
}在 managed settings 或 server-managed settings 中设置。这样每个新会话都从关闭状态开始,用户需要手动 /fast 开启,有助于控制多会话并发时的费用。
触发限流后的自动回退
Fast Mode 有独立的速率限制。触发后:
- 自动回退到标准 Opus 4.6
↯图标变灰,表示冷却中- 继续以标准速度和费率工作
- 冷却结束后,Fast Mode 自动重新开启
不想等冷却?再次运行 /fast 手动关闭。
相关文档
- 模型配置 — 切换模型和调整推理力度
- 成本管理 — 追踪 token 用量和控制费用
- Status Line 配置 — 实时显示模型和上下文信息