Skip to content

Claude 4.6 Opus 和 Sonnet 引入两项主要变化:①自适应思考(thinking.type: 'adaptive')成为默认推理模式,Claude 根据任务复杂度自动决定思考量,无需手动设置 budget_tokens;②新增 verbosity: 'max' 努力等级(仅 Opus 4.6 和 Sonnet 4.6 支持)。不指定 reasoning.max_tokens 时自动使用自适应思考;reasoning.effort 参数在 4.6 中被忽略;旧版参数继续兼容,无 Breaking Change。

Claude 4.6 Opus 和 4.6 Sonnet 引入了两项推理参数变化。本文记录 OpenRouter 侧的具体行为变化,帮助你平滑迁移。

官方变化概述:Anthropic - What's new in Claude 4.6

变化一:自适应思考(Adaptive Thinking)成为默认

对于 Claude 4.6 Opus 和 4.6 Sonnet,OpenRouter 现在默认使用自适应思考thinking.type: 'adaptive'),而不是基于预算的思考(thinking.type: 'enabled' + budget_tokens)。

工作原理

  • 启用推理但不指定 reasoning.max_tokens 时,Claude 4.6 Opus 和 Sonnet 使用自适应思考
  • Claude 根据任务复杂度自动决定推理量
  • 无需估算或调整 token 预算
json
// 自适应思考(推荐用于 4.6)
{
  "model": "anthropic/claude-4.6-opus",
  "reasoning": { "enabled": true }
}

仍使用预算式思考的情况

  • 显式设置了 reasoning.max_tokens
  • 直接传入原始 Anthropic thinking 参数
json
// 预算式思考(仍受支持)
{
  "model": "anthropic/claude-4.6-opus",
  "reasoning": { "enabled": true, "max_tokens": 10000 }
}

变化二:新增 max 努力等级

Claude 4.6 Opus 和 Sonnet 通过 verbosity 参数新增 'max' 努力等级:

json
{
  "model": "anthropic/claude-4.6-opus",
  "verbosity": "max"
}

'max' 仅在 Claude 4.6 Opus 和 Sonnet 上有效,在旧版模型上自动降级为 'high'

verbosity 与 reasoning.effort 的区别

两者是不同维度的参数:

参数控制内容4.6 行为
verbosity响应详细程度(output_config.effort正常工作,支持 'max'
reasoning.effort思考 token 预算被忽略(使用自适应思考)
json
// verbosity 生效 — 控制响应详细程度
{ "model": "anthropic/claude-4.6-opus", "verbosity": "max" }
json
// reasoning.effort 被忽略 — 仍然使用自适应思考
{ "model": "anthropic/claude-4.6-opus", "reasoning": { "enabled": true, "effort": "low" } }

Breaking Changes

无 Breaking Change。 现有请求继续正常工作:

  • 设置了 reasoning.max_tokens 时,预算式思考仍然有效
  • 旧版模型(4.5 Opus、3.7 Sonnet 等)行为完全不变
功能Opus 4.5Opus 4.6 / Sonnet 4.6
默认思考模式预算式自适应
reasoning.max_tokens预算式预算式
verbosity: 'max'降级为 high支持

常见问题

Q: 自适应思考和预算式思考各有什么优缺点?

A: 自适应思考的优点是无需调参、Claude 能在复杂任务上自动深入思考而不超出必要范围;缺点是对 token 消耗预测性较差。预算式思考的优点是成本可预测,适合对延迟和费用有严格控制需求的场景。

Q: 如何判断我的请求是否使用了自适应思考?

A: 检查响应中是否有 thinking 内容块,以及响应头中的 x-openrouter-thinking-type 字段。如果没有显式设置 reasoning.max_tokens,Claude 4.6 Opus 和 Sonnet 的请求会使用自适应思考。

Q: reasoning.effort 在 4.6 上被忽略,那如何控制推理深度?

A: 在 4.6 上,推理深度由 Claude 根据任务自适应决定。如果需要强制较多推理,可以通过设置 reasoning.max_tokens 切换回预算式思考并给定较大预算。