Appearance
Claude 4.6 Opus 和 Sonnet 引入两项主要变化:①自适应思考(thinking.type: 'adaptive')成为默认推理模式,Claude 根据任务复杂度自动决定思考量,无需手动设置 budget_tokens;②新增 verbosity: 'max' 努力等级(仅 Opus 4.6 和 Sonnet 4.6 支持)。不指定 reasoning.max_tokens 时自动使用自适应思考;reasoning.effort 参数在 4.6 中被忽略;旧版参数继续兼容,无 Breaking Change。
Claude 4.6 Opus 和 4.6 Sonnet 引入了两项推理参数变化。本文记录 OpenRouter 侧的具体行为变化,帮助你平滑迁移。
官方变化概述:Anthropic - What's new in Claude 4.6
变化一:自适应思考(Adaptive Thinking)成为默认
对于 Claude 4.6 Opus 和 4.6 Sonnet,OpenRouter 现在默认使用自适应思考(thinking.type: 'adaptive'),而不是基于预算的思考(thinking.type: 'enabled' + budget_tokens)。
工作原理
- 启用推理但不指定
reasoning.max_tokens时,Claude 4.6 Opus 和 Sonnet 使用自适应思考 - Claude 根据任务复杂度自动决定推理量
- 无需估算或调整 token 预算
json
// 自适应思考(推荐用于 4.6)
{
"model": "anthropic/claude-4.6-opus",
"reasoning": { "enabled": true }
}仍使用预算式思考的情况
- 显式设置了
reasoning.max_tokens - 直接传入原始 Anthropic
thinking参数
json
// 预算式思考(仍受支持)
{
"model": "anthropic/claude-4.6-opus",
"reasoning": { "enabled": true, "max_tokens": 10000 }
}变化二:新增 max 努力等级
Claude 4.6 Opus 和 Sonnet 通过 verbosity 参数新增 'max' 努力等级:
json
{
"model": "anthropic/claude-4.6-opus",
"verbosity": "max"
}'max' 仅在 Claude 4.6 Opus 和 Sonnet 上有效,在旧版模型上自动降级为 'high'。
verbosity 与 reasoning.effort 的区别
两者是不同维度的参数:
| 参数 | 控制内容 | 4.6 行为 |
|---|---|---|
verbosity | 响应详细程度(output_config.effort) | 正常工作,支持 'max' |
reasoning.effort | 思考 token 预算 | 被忽略(使用自适应思考) |
json
// verbosity 生效 — 控制响应详细程度
{ "model": "anthropic/claude-4.6-opus", "verbosity": "max" }json
// reasoning.effort 被忽略 — 仍然使用自适应思考
{ "model": "anthropic/claude-4.6-opus", "reasoning": { "enabled": true, "effort": "low" } }Breaking Changes
无 Breaking Change。 现有请求继续正常工作:
- 设置了
reasoning.max_tokens时,预算式思考仍然有效 - 旧版模型(4.5 Opus、3.7 Sonnet 等)行为完全不变
| 功能 | Opus 4.5 | Opus 4.6 / Sonnet 4.6 |
|---|---|---|
| 默认思考模式 | 预算式 | 自适应 |
reasoning.max_tokens | 预算式 | 预算式 |
verbosity: 'max' | 降级为 high | 支持 |
常见问题
Q: 自适应思考和预算式思考各有什么优缺点?
A: 自适应思考的优点是无需调参、Claude 能在复杂任务上自动深入思考而不超出必要范围;缺点是对 token 消耗预测性较差。预算式思考的优点是成本可预测,适合对延迟和费用有严格控制需求的场景。
Q: 如何判断我的请求是否使用了自适应思考?
A: 检查响应中是否有 thinking 内容块,以及响应头中的 x-openrouter-thinking-type 字段。如果没有显式设置 reasoning.max_tokens,Claude 4.6 Opus 和 Sonnet 的请求会使用自适应思考。
Q: reasoning.effort 在 4.6 上被忽略,那如何控制推理深度?
A: 在 4.6 上,推理深度由 Claude 根据任务自适应决定。如果需要强制较多推理,可以通过设置 reasoning.max_tokens 切换回预算式思考并给定较大预算。