Appearance
模型配置
Claude Code 支持灵活的模型配置,包括便捷的别名、企业级模型限制、100万 token 扩展上下文,以及推理力度调节。
可用模型
配置 model 字段时,可以填以下两类值:
- 模型别名:简短名称,始终指向最新版本
- 模型全名:具体版本号(Anthropic API 用 model name,Bedrock 用 inference profile ARN,Foundry 用 deployment name,Vertex 用 version name)
模型别名对照表
| 别名 | 说明 |
|---|---|
default | 根据账户类型推荐的模型 |
sonnet | 最新 Sonnet(当前 4.6),日常编程首选 |
opus | 最新 Opus(当前 4.6),复杂推理任务 |
haiku | 最快最轻量,适合简单任务 |
sonnet[1m] | Sonnet + 100 万 token 上下文窗口 |
opus[1m] | Opus + 100 万 token 上下文窗口 |
opusplan | 计划阶段用 Opus,执行阶段自动切 Sonnet |
别名始终指向最新版本。要锁定特定版本,用完整 model name(如
claude-opus-4-6)或设置环境变量ANTHROPIC_DEFAULT_OPUS_MODEL。
特殊:opusplan 混合模式
opusplan 是个聪明的折中方案:
- 计划阶段:使用 Opus,充分发挥其复杂推理能力
- 执行阶段:自动切换到 Sonnet,兼顾速度和成本
架构设计时动用 Opus 的深度思考,写代码时用 Sonnet 的效率——两全其美。
切换模型的四种方式(按优先级)
1. 会话内切换(优先级最高)
bash
/model sonnet
/model opus
/model opusplan2. 启动时指定
bash
claude --model opus
claude --model sonnet[1m]3. 环境变量
bash
export ANTHROPIC_MODEL=opus4. 配置文件(持久生效)
json
{
"model": "opus"
}查看当前使用的模型
- 配置了 status line 可以实时看到
- 运行
/status查看当前模型和账户信息
企业管理:限制可用模型
企业管理员可以在 managed/policy settings 里设置 availableModels,限制用户只能选哪些模型:
json
{
"availableModels": ["sonnet", "haiku"]
}设置后,用户无法通过 /model、--model、ANTHROPIC_MODEL 切换到不在列表里的模型。
注意:default(默认选项)不受 availableModels 限制,始终可用。
固定所有用户使用特定模型
model(设置具体模型)+ availableModels(限制选项)配合使用:
json
{
"model": "sonnet",
"availableModels": ["sonnet", "haiku"]
}这样所有用户默认跑 Sonnet 4.6,只能在 Sonnet 和 Haiku 之间选。
多层配置时的合并规则
多个 settings 层都设置了 availableModels 时,数组会合并去重。要强制执行严格白名单,在 managed/policy settings(最高优先级)设置。
各账户类型的默认模型
default 别名根据账户类型有不同行为:
- Max 和 Team Premium:默认 Opus 4.6
- Pro 和 Team Standard:默认 Sonnet 4.6
- Enterprise:Opus 4.6 可用但不是默认
如果 Opus 用量超过阈值,Claude Code 会自动降级到 Sonnet。
调整推理力度(Effort Level)
Opus 4.6 和 Sonnet 4.6 支持自适应推理,根据任务复杂度动态分配"思考时间"。
四个力度档:
| 力度 | 说明 |
|---|---|
low | 快速响应,适合简单直接的任务 |
medium | 默认档,平衡质量和速度 |
high | 深度推理,适合复杂问题 |
max | 最深推理,不限 token,仅 Opus 4.6 支持,不持久化 |
设置方式:
- 命令:
/effort low、/effort medium、/effort high、/effort max,/effort auto重置 - 启动参数:
claude --effort high - 环境变量:
CLAUDE_CODE_EFFORT_LEVEL=high - 配置文件:
"effortLevel": "high" - Skill/Subagent frontmatter:
effort: high(仅对该 skill 有效)
当前力度会显示在 Logo 旁边(如"with low effort"),方便确认。
禁用自适应推理(回退到固定 token 预算):CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1
Fast Mode vs 低推理力度的区别
| 设置 | 效果 |
|---|---|
Fast Mode(/fast) | 同等质量,更低延迟,更高费用 |
| 低推理力度 | 减少思考时间,更快但复杂任务质量可能下降 |
两者可以组合使用:Fast Mode + low effort = 最快响应(适合简单任务)。
扩展上下文:100 万 Token
Opus 4.6 和 Sonnet 4.6 支持 100 万 token 上下文窗口,适合超大型代码库。
各订阅计划支持情况:
| 计划 | Opus 4.6 1M 上下文 | Sonnet 4.6 1M 上下文 |
|---|---|---|
| Max、Team、Enterprise | 订阅内含 | 需要 Extra Usage |
| Pro | 需要 Extra Usage | 需要 Extra Usage |
| API / 按量付费 | 完整访问 | 完整访问 |
启用方式:
bash
/model opus[1m]
/model sonnet[1m]
/model claude-opus-4-6[1m]禁用 1M 上下文:CLAUDE_CODE_DISABLE_1M_CONTEXT=1
1M 上下文使用标准 token 定价,200K 以上不额外收费。
第三方部署时锁定模型版本
通过 Bedrock、Vertex AI 或 Foundry 部署时,强烈建议锁定模型版本,避免 Claude Code 更新后别名指向新模型导致用户访问报错。
bash
# Bedrock 示例
export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-6-v1'
export ANTHROPIC_DEFAULT_SONNET_MODEL='us.anthropic.claude-sonnet-4-6-20251101'
export ANTHROPIC_DEFAULT_HAIKU_MODEL='us.anthropic.claude-haiku-4-5-20251001'三个环境变量全部设置,不要遗漏任何一个。升级模型版本时,更新环境变量并重新部署。
为不同版本配置不同 ARN(modelOverrides)
如果需要把多个 Anthropic model ID 映射到不同的提供商特定 ID(如 Bedrock ARN),用 modelOverrides:
json
{
"modelOverrides": {
"claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
"claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
}
}模型相关环境变量
| 变量 | 说明 |
|---|---|
ANTHROPIC_DEFAULT_OPUS_MODEL | opus 别名(及 opusplan 计划阶段)的实际模型 |
ANTHROPIC_DEFAULT_SONNET_MODEL | sonnet 别名(及 opusplan 执行阶段)的实际模型 |
ANTHROPIC_DEFAULT_HAIKU_MODEL | haiku 别名及后台功能的模型 |
CLAUDE_CODE_SUBAGENT_MODEL | 子代理使用的模型 |
ANTHROPIC_MODEL | 直接指定使用的模型 |
ANTHROPIC_CUSTOM_MODEL_OPTION | 在 /model 选择器添加自定义条目 |
CLAUDE_CODE_EFFORT_LEVEL | 推理力度(low/medium/high/max/auto) |
CLAUDE_CODE_DISABLE_1M_CONTEXT | 设为 1 禁用 1M 上下文 |
CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING | 设为 1 禁用自适应推理 |
CLAUDE_CODE_DISABLE_FAST_MODE | 设为 1 禁用 Fast Mode |
Prompt Cache 配置
| 变量 | 说明 |
|---|---|
DISABLE_PROMPT_CACHING | 设为 1 全局禁用 prompt cache |
DISABLE_PROMPT_CACHING_HAIKU | 仅禁用 Haiku 的 prompt cache |
DISABLE_PROMPT_CACHING_SONNET | 仅禁用 Sonnet 的 prompt cache |
DISABLE_PROMPT_CACHING_OPUS | 仅禁用 Opus 的 prompt cache |
相关文档
- Fast Mode — 用更高费用换取更低延迟
- 成本管理 — 追踪 token 用量和控制费用
- Status Line — 实时显示当前模型信息
- 设置参考 — 完整的配置文件说明