Claude 4.6 迁移指南：自适应思考模式与 max 努力等级配置

Claude 4.6 Opus 和 Sonnet 引入两项主要变化：①自适应思考（thinking.type: 'adaptive'）成为默认推理模式，Claude 根据任务复杂度自动决定思考量，无需手动设置 budget_tokens；②新增 verbosity: 'max' 努力等级（仅 Opus 4.6 和 Sonnet 4.6 支持）。不指定 reasoning.max_tokens 时自动使用自适应思考；reasoning.effort 参数在 4.6 中被忽略；旧版参数继续兼容，无 Breaking Change。

Claude 4.6 Opus 和 4.6 Sonnet 引入了两项推理参数变化。本文记录 OpenRouter 侧的具体行为变化，帮助你平滑迁移。

官方变化概述：Anthropic - What’s new in Claude 4.6

变化一：自适应思考（Adaptive Thinking）成为默认

对于 Claude 4.6 Opus 和 4.6 Sonnet，OpenRouter 现在默认使用自适应思考（thinking.type: 'adaptive'），而不是基于预算的思考（thinking.type: 'enabled' + budget_tokens）。

工作原理

启用推理但不指定 reasoning.max_tokens 时，Claude 4.6 Opus 和 Sonnet 使用自适应思考
Claude 根据任务复杂度自动决定推理量
无需估算或调整 token 预算

// 自适应思考（推荐用于 4.6）
{
  "model": "anthropic/claude-4.6-opus",
  "reasoning": { "enabled": true }
}

仍使用预算式思考的情况

显式设置了 reasoning.max_tokens
直接传入原始 Anthropic thinking 参数

// 预算式思考（仍受支持）
{
  "model": "anthropic/claude-4.6-opus",
  "reasoning": { "enabled": true, "max_tokens": 10000 }
}

变化二：新增 `max` 努力等级

Claude 4.6 Opus 和 Sonnet 通过 verbosity 参数新增 'max' 努力等级：

{
  "model": "anthropic/claude-4.6-opus",
  "verbosity": "max"
}

'max' 仅在 Claude 4.6 Opus 和 Sonnet 上有效，在旧版模型上自动降级为 'high'。

verbosity 与 reasoning.effort 的区别

两者是不同维度的参数：

参数	控制内容	4.6 行为
`verbosity`	响应详细程度（`output_config.effort`）	正常工作，支持 `'max'`
`reasoning.effort`	思考 token 预算	被忽略（使用自适应思考）

// verbosity 生效 — 控制响应详细程度
{ "model": "anthropic/claude-4.6-opus", "verbosity": "max" }

// reasoning.effort 被忽略 — 仍然使用自适应思考
{ "model": "anthropic/claude-4.6-opus", "reasoning": { "enabled": true, "effort": "low" } }

Breaking Changes

无 Breaking Change。 现有请求继续正常工作：

设置了 reasoning.max_tokens 时，预算式思考仍然有效
旧版模型（4.5 Opus、3.7 Sonnet 等）行为完全不变

功能	Opus 4.5	Opus 4.6 / Sonnet 4.6
默认思考模式	预算式	自适应
`reasoning.max_tokens`	预算式	预算式
`verbosity: 'max'`	降级为 `high`	支持

常见问题

Q: 自适应思考和预算式思考各有什么优缺点？

A: 自适应思考的优点是无需调参、Claude 能在复杂任务上自动深入思考而不超出必要范围；缺点是对 token 消耗预测性较差。预算式思考的优点是成本可预测，适合对延迟和费用有严格控制需求的场景。

Q: 如何判断我的请求是否使用了自适应思考？

A: 检查响应中是否有 thinking 内容块，以及响应头中的 x-openrouter-thinking-type 字段。如果没有显式设置 reasoning.max_tokens，Claude 4.6 Opus 和 Sonnet 的请求会使用自适应思考。

Q: reasoning.effort 在 4.6 上被忽略，那如何控制推理深度？

A: 在 4.6 上，推理深度由 Claude 根据任务自适应决定。如果需要强制较多推理，可以通过设置 reasoning.max_tokens 切换回预算式思考并给定较大预算。

Claude 4.6 迁移指南：自适应思考模式与 max 努力等级配置

变化一：自适应思考（Adaptive Thinking）成为默认 #

工作原理 #

仍使用预算式思考的情况 #

变化二：新增 max 努力等级 #

verbosity 与 reasoning.effort 的区别 #

Breaking Changes #