Skip to content

模型配置

Claude Code 支持灵活的模型配置,包括便捷的别名、企业级模型限制、100万 token 扩展上下文,以及推理力度调节。

可用模型

配置 model 字段时,可以填以下两类值:

  • 模型别名:简短名称,始终指向最新版本
  • 模型全名:具体版本号(Anthropic API 用 model name,Bedrock 用 inference profile ARN,Foundry 用 deployment name,Vertex 用 version name)

模型别名对照表

别名说明
default根据账户类型推荐的模型
sonnet最新 Sonnet(当前 4.6),日常编程首选
opus最新 Opus(当前 4.6),复杂推理任务
haiku最快最轻量,适合简单任务
sonnet[1m]Sonnet + 100 万 token 上下文窗口
opus[1m]Opus + 100 万 token 上下文窗口
opusplan计划阶段用 Opus,执行阶段自动切 Sonnet

别名始终指向最新版本。要锁定特定版本,用完整 model name(如 claude-opus-4-6)或设置环境变量 ANTHROPIC_DEFAULT_OPUS_MODEL

特殊:opusplan 混合模式

opusplan 是个聪明的折中方案:

  • 计划阶段:使用 Opus,充分发挥其复杂推理能力
  • 执行阶段:自动切换到 Sonnet,兼顾速度和成本

架构设计时动用 Opus 的深度思考,写代码时用 Sonnet 的效率——两全其美。

切换模型的四种方式(按优先级)

1. 会话内切换(优先级最高)

bash
/model sonnet
/model opus
/model opusplan

2. 启动时指定

bash
claude --model opus
claude --model sonnet[1m]

3. 环境变量

bash
export ANTHROPIC_MODEL=opus

4. 配置文件(持久生效)

json
{
  "model": "opus"
}

查看当前使用的模型

  • 配置了 status line 可以实时看到
  • 运行 /status 查看当前模型和账户信息

企业管理:限制可用模型

企业管理员可以在 managed/policy settings 里设置 availableModels,限制用户只能选哪些模型:

json
{
  "availableModels": ["sonnet", "haiku"]
}

设置后,用户无法通过 /model--modelANTHROPIC_MODEL 切换到不在列表里的模型。

注意default(默认选项)不受 availableModels 限制,始终可用。

固定所有用户使用特定模型

model(设置具体模型)+ availableModels(限制选项)配合使用:

json
{
  "model": "sonnet",
  "availableModels": ["sonnet", "haiku"]
}

这样所有用户默认跑 Sonnet 4.6,只能在 Sonnet 和 Haiku 之间选。

多层配置时的合并规则

多个 settings 层都设置了 availableModels 时,数组会合并去重。要强制执行严格白名单,在 managed/policy settings(最高优先级)设置。


各账户类型的默认模型

default 别名根据账户类型有不同行为:

  • Max 和 Team Premium:默认 Opus 4.6
  • Pro 和 Team Standard:默认 Sonnet 4.6
  • Enterprise:Opus 4.6 可用但不是默认

如果 Opus 用量超过阈值,Claude Code 会自动降级到 Sonnet。


调整推理力度(Effort Level)

Opus 4.6 和 Sonnet 4.6 支持自适应推理,根据任务复杂度动态分配"思考时间"。

四个力度档:

力度说明
low快速响应,适合简单直接的任务
medium默认档,平衡质量和速度
high深度推理,适合复杂问题
max最深推理,不限 token,仅 Opus 4.6 支持,不持久化

设置方式:

  • 命令:/effort low/effort medium/effort high/effort max/effort auto 重置
  • 启动参数:claude --effort high
  • 环境变量:CLAUDE_CODE_EFFORT_LEVEL=high
  • 配置文件:"effortLevel": "high"
  • Skill/Subagent frontmatter:effort: high(仅对该 skill 有效)

当前力度会显示在 Logo 旁边(如"with low effort"),方便确认。

禁用自适应推理(回退到固定 token 预算):CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1

Fast Mode vs 低推理力度的区别

设置效果
Fast Mode(/fast同等质量,更低延迟,更高费用
低推理力度减少思考时间,更快但复杂任务质量可能下降

两者可以组合使用:Fast Mode + low effort = 最快响应(适合简单任务)。


扩展上下文:100 万 Token

Opus 4.6 和 Sonnet 4.6 支持 100 万 token 上下文窗口,适合超大型代码库。

各订阅计划支持情况:

计划Opus 4.6 1M 上下文Sonnet 4.6 1M 上下文
Max、Team、Enterprise订阅内含需要 Extra Usage
Pro需要 Extra Usage需要 Extra Usage
API / 按量付费完整访问完整访问

启用方式:

bash
/model opus[1m]
/model sonnet[1m]
/model claude-opus-4-6[1m]

禁用 1M 上下文:CLAUDE_CODE_DISABLE_1M_CONTEXT=1

1M 上下文使用标准 token 定价,200K 以上不额外收费。


第三方部署时锁定模型版本

通过 Bedrock、Vertex AI 或 Foundry 部署时,强烈建议锁定模型版本,避免 Claude Code 更新后别名指向新模型导致用户访问报错。

bash
# Bedrock 示例
export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-6-v1'
export ANTHROPIC_DEFAULT_SONNET_MODEL='us.anthropic.claude-sonnet-4-6-20251101'
export ANTHROPIC_DEFAULT_HAIKU_MODEL='us.anthropic.claude-haiku-4-5-20251001'

三个环境变量全部设置,不要遗漏任何一个。升级模型版本时,更新环境变量并重新部署。

为不同版本配置不同 ARN(modelOverrides)

如果需要把多个 Anthropic model ID 映射到不同的提供商特定 ID(如 Bedrock ARN),用 modelOverrides

json
{
  "modelOverrides": {
    "claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
    "claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
  }
}

模型相关环境变量

变量说明
ANTHROPIC_DEFAULT_OPUS_MODELopus 别名(及 opusplan 计划阶段)的实际模型
ANTHROPIC_DEFAULT_SONNET_MODELsonnet 别名(及 opusplan 执行阶段)的实际模型
ANTHROPIC_DEFAULT_HAIKU_MODELhaiku 别名及后台功能的模型
CLAUDE_CODE_SUBAGENT_MODEL子代理使用的模型
ANTHROPIC_MODEL直接指定使用的模型
ANTHROPIC_CUSTOM_MODEL_OPTION/model 选择器添加自定义条目
CLAUDE_CODE_EFFORT_LEVEL推理力度(low/medium/high/max/auto)
CLAUDE_CODE_DISABLE_1M_CONTEXT设为 1 禁用 1M 上下文
CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING设为 1 禁用自适应推理
CLAUDE_CODE_DISABLE_FAST_MODE设为 1 禁用 Fast Mode

Prompt Cache 配置

变量说明
DISABLE_PROMPT_CACHING设为 1 全局禁用 prompt cache
DISABLE_PROMPT_CACHING_HAIKU仅禁用 Haiku 的 prompt cache
DISABLE_PROMPT_CACHING_SONNET仅禁用 Sonnet 的 prompt cache
DISABLE_PROMPT_CACHING_OPUS仅禁用 Opus 的 prompt cache

相关文档