Appearance
Fast Mode:Opus 4.6 高速响应模式
Fast Mode 是 Opus 4.6 的高速配置,响应速度比标准模式快 2.5 倍,但 token 费用更高(输入 $30/MTok,输出 $150/MTok)。本质上不是换模型,而是同一个 Opus 4.6 换了优先速度的 API 配置——质量和能力完全相同。通过 /fast 命令切换开关,或在设置中持久启用。适合快速迭代、实时调试等对响应延迟敏感的场景。需要 Extra Usage 且不支持第三方云(Bedrock/Vertex/Foundry)。
Fast Mode 是 Opus 4.6 的高速配置,响应速度提升 2.5 倍,代价是更高的 token 费用。用 /fast 在需要速度时开启,不需要时关闭。
Fast Mode 不是换模型——使用的是同一个 Opus 4.6,只是换了优先速度而非成本效率的 API 配置。质量和能力完全相同,只是更快。
Fast Mode 是研究预览功能,功能、定价和可用性可能根据反馈调整。
切换 Fast Mode
两种方式:
命令切换:
/fast再次运行 /fast 切换开/关。也可在 VS Code 扩展中通过 /fast 切换。
设置文件持久启用:
json
{
"fastMode": true
}开启后:
- 如果当前不是 Opus 4.6,自动切换到 Opus 4.6
- 出现确认消息:"Fast mode ON"
- 提示符旁出现
↯图标
关闭 Fast Mode 后,你保留在 Opus 4.6 上,不会自动切回之前的模型。要切换模型,使用 /model。
成本权衡
| 模式 | 输入(每百万 token) | 输出(每百万 token) |
|---|---|---|
| Fast Mode Opus 4.6 | $30 | $150 |
Fast Mode 定价在整个 100 万 token 上下文窗口内统一计算。
重要:如果在会话中途开启 Fast Mode,整个已有上下文都会按 Fast Mode 未缓存的输入 token 价格重新计费——比从会话开始就启用要贵得多。建议在会话开始时就决定是否使用 Fast Mode,不要中途切换。
什么时候用 Fast Mode
适合:
- 快速迭代代码变更
- 实时 debug 会话
- 时间紧迫的高压工作
不适合:
- 长时间自主运行的任务(速度不是首要考虑)
- CI/CD 批处理
- 注重成本控制的工作
Fast Mode vs 降低推理力度
| 设置 | 效果 |
|---|---|
| Fast Mode | 相同质量,更低延迟,更高费用 |
低推理力度(/effort low) | 减少思考时间,更快但复杂任务质量可能下降 |
两者可以组合:Fast Mode + 低推理力度 = 极致速度,适合不需要深度思考的简单任务。
使用要求
Fast Mode 需要同时满足以下条件:
不支持第三方云:不可用于 Amazon Bedrock、Google Vertex AI 或 Microsoft Azure Foundry。仅支持 Anthropic Console API 和订阅计划(Pro/Max/Team/Enterprise)的 Extra Usage。
需要启用 Extra Usage:允许超出套餐用量后继续计费
- 个人账号:在 Console 账单设置 中开启
- Team/Enterprise:管理员需为组织开启 Extra Usage
Team/Enterprise 还需管理员额外开启(默认关闭):
- Console(API 用户):在 Claude Code preferences 开启
- Claude AI(Team/Enterprise):在 Admin Settings > Claude Code 开启
完全禁用 Fast Mode:设置环境变量 CLAUDE_CODE_DISABLE_FAST_MODE=1,详见环境变量。
企业管理:要求每次会话手动开启
默认情况下,Fast Mode 跨会话持久保存。Team/Enterprise 管理员可以阻止这种行为,让每次会话都从关闭状态开始,要求用户显式开启:
json
{
"fastModePerSessionOptIn": true
}在托管设置或 server-managed settings 中配置。用户仍可通过 /fast 在需要时开启,但每次新会话都会重置,有助于控制多会话并发时的费用。
移除此设置后,用户的 Fast Mode 偏好恢复持久保存的默认行为。
触发限流后的自动回退
Fast Mode 有独立的速率限制。触发限流或 Extra Usage 耗尽后:
- 自动回退到标准 Opus 4.6
↯图标变灰,表示冷却中- 继续以标准速度和费率工作
- 冷却期结束后,Fast Mode 自动重新开启
不想等冷却?再次运行 /fast 手动关闭。
相关文档
- 模型配置:切换模型和调整推理力度
- 成本管理:追踪 token 用量和控制费用
- Status Line 配置:实时显示模型和上下文信息
常见问题
Q: Fast Mode 开启后,模型质量会变吗?
不会。Fast Mode 使用的是同一个 Opus 4.6,只是 API 配置不同——优先速度而非成本效率。质量和能力与标准模式完全相同。
Q: 为什么不建议在会话中途开启 Fast Mode?
因为开启时,已有的整个上下文会按 Fast Mode 未缓存的输入价格重新计费,比从会话开始就启用要贵得多。建议在会话开始前就决定是否需要速度优先。
Q: Fast Mode 触发限流后可以继续使用 Claude Code 吗?
可以。触发限流后会自动回退到标准 Opus 4.6 继续工作,↯ 图标变灰表示冷却中。冷却结束后 Fast Mode 自动恢复。