Kiro CLI 提供 Auto、Claude、DeepSeek、MiniMax、GLM、Qwen 等多类 models。选择模型时不要只看“最强”，还要同时考虑上下文窗口、credit 成本、region、订阅层级和任务复杂度。多数日常开发从 Auto 开始即可。

Kiro CLI models：按任务选择质量、速度与成本的平衡点

Kiro CLI 可以访问 frontier models 和 open weight models。不同模型的优势不一样：有的适合长上下文架构设计，有的适合快速修改，有的适合低成本长会话。对团队来说，合理的模型策略能同时控制质量、速度和 credits 消耗。

如果你不确定怎么选，先用 Auto。Auto 会根据任务自动路由，在质量和成本之间做平衡。

快速对比

Model	Context window	Cost	Region	Free	Pro	Pro+	Power	Auth
Claude Opus 4.7	1M	2.2x	us-east-1, eu-central-1		✓	✓	✓	IDC
Claude Opus 4.6	1M	2.2x	us-east-1, eu-central-1		✓	✓	✓	All
Claude Opus 4.5	200K	2.2x	us-east-1, eu-central-1		✓	✓	✓	All
Claude Sonnet 4.6	1M	1.3x	us-east-1, eu-central-1		✓	✓	✓	All
Claude Sonnet 4.5	200K	1.3x	us-east-1, eu-central-1	✓	✓	✓	✓	All
Claude Sonnet 4.0	200K	1.3x	us-east-1, eu-central-1	✓	✓	✓	✓	All
Auto		1.0x	us-east-1, eu-central-1	✓	✓	✓	✓	All
Claude Haiku 4.5	200K	0.4x	us-east-1, eu-central-1		✓	✓	✓	All
DeepSeek 3.2	128K	0.25x	us-east-1	✓	✓	✓	✓	All
MiniMax M2.5	200K	0.25x	us-east-1, eu-central-1	✓	✓	✓	✓	All
GLM-5	200K	0.5x	us-east-1	✓	✓	✓	✓	All
MiniMax M2.1	200K	0.15x	us-east-1, eu-central-1	✓	✓	✓	✓	All
Qwen3 Coder Next	256K	0.05x	us-east-1, eu-central-1	✓	✓	✓	✓	All

Cost 以 Auto 的 1.0x 为基准。例如，一个任务在 Auto 下消耗 10 credits，使用 Opus 可能消耗 22 credits，使用 Haiku 约 4 credits，使用 Qwen3 Coder Next 约 0.5 credits。

如何切换模型

可以在 chat interface 的 model dropdown 中选择，也可以用命令设置默认模型：

kiro-cli settings chat.defaultModel claude-opus-4.7

如果某个模型没有出现在下拉列表中，先重启客户端。模型可见性可能受订阅、region、auth 方式和灰度发布影响。

在当前会话中选好模型后，也可以把它保存为未来所有 session 的默认模型：

> /model set-current-as-default

该偏好会写入：

~/.kiro/settings/cli.json

之后新 session 会自动使用这个默认模型。

应该选哪个模型

场景	推荐模型	原因
通用开发	Auto	自动为每个任务路由合适模型，兼顾质量和成本
可预测基线	Sonnet 4.0	没有路由层，每次都是同一模型，行为更稳定
强 agentic coding	Sonnet 4.5	规划、长时间自主执行和 tool usage 更强
高智力但更高效	Sonnet 4.6	接近 Opus 智能，token 效率和指令遵循更好
大型代码库或长 spec	Opus 4.7	更强 agentic coding、自检和复杂指令遵循
大型代码库或长 spec	Opus 4.6	深度推理、跨大代码库规划和调试能力强
多系统复杂问题	Opus 4.5	适合高歧义、高取舍的复杂软件工程问题
快速迭代或节省 credits	Haiku 4.5	速度快、成本低，适合小改动和子代理编排
低成本 coding	DeepSeek 3.2	适合 agentic workflow 和多步推理，成本较低
低成本前沿 coding	MiniMax M2.5	编码能力强，成本远低于高端模型
仓库级 agentic work	GLM-5	200K context，适合长周期跨文件工作
多语言编程	MiniMax M2.1	Rust、Go、C++、Kotlin、TypeScript 和 UI 生成表现较好
长时间 CLI coding	Qwen3 Coder Next	256K context，错误恢复强，成本最低

实务建议：不要把 Opus 当默认模型无限使用。把它留给“Auto 或 Sonnet 已经卡住”的任务，通常更划算。

模型可用性

Model availability 会因 country、region、provider 要求和 Kiro 发布策略变化。Kiro 的模型供给会遵循各模型提供商对第三方服务和接口的使用条件。

如果某个模型不可用，检查以下因素：

当前账号订阅层级是否支持。
账号登录方式是否满足 Auth 要求，例如 IDC。
所在 region 是否支持该模型。
模型是否处于 Experimental 灰度阶段。

可参考各 provider 的支持区域说明，例如 Anthropic supported countries，以及 Qwen、DeepSeek、Kimi、MiniMax、GLM 的官方说明。

主要模型说明

Auto（推荐默认）

Auto 是 Kiro 的 model router，会组合多个 frontier models 和优化策略，为每个任务选择更合适的模型。它的目标不是永远选择最贵模型，而是在质量和成本之间达到较优平衡，通常能交付 Sonnet 4 级别的结果。

Claude Opus 4.7

Claude Opus 4.7 是 Anthropic 面向高难软件工程任务的最新高能力模型。它适合复杂、长时间、需要严格自检的 agentic work，也支持更高分辨率视觉输入，适合处理复杂截图和图表。目前在 us-east-1 和 eu-central-1 可用，并通过 cross-region inference 面向部分 AWS IAM Identity Center 用户滚动开放。更多信息见 Claude Opus 4.7。

Claude Opus 4.6 / 4.5

Opus 系列适合复杂架构、跨系统排障、长 spec 实现和高风险代码审查。它通常会在行动前做更深入规划，也更愿意发现并修正自己的错误。更多信息见 Claude Opus 4.6 和 Claude Opus 4.5。

Claude Sonnet 4.6 / 4.5 / 4.0

Sonnet 系列适合大多数专业开发任务。Sonnet 4.6 更接近 Opus 智能，同时更节省 token；Sonnet 4.5 在 agentic coding、工具使用和安全工程上表现强；Sonnet 4.0 适合需要固定模型、可预测行为的流程。更多信息见 Claude Sonnet 4.6、Claude Sonnet 4.5 和 Claude 4。

Claude Haiku 4.5

Haiku 4.5 适合快速迭代、简单修复、轻量 review 和子代理 orchestration。它成本低、速度快，并支持 extended thinking。更多信息见 Claude Haiku 4.5。

Open weight models

Kiro CLI 也提供多种 open weight models：

MiniMax M2.5：低成本但 coding 能力强，适合完整开发生命周期。
GLM-5：200K context，适合大仓库、多步骤工具调用和长期任务。
DeepSeek 3.2：适合 agentic workflow、代码生成和多步推理。
MiniMax M2.1：适合多语言编程和 UI generation。
Qwen3 Coder Next：256K context，适合长 CLI coding session，credit 成本最低。

模型行为差异

理解模型行为比记住排行榜更有用。

Planning depth：Opus 往往先想得更久，会考虑多步方案和边界情况；Sonnet 与 Haiku 更直接，启动更快。
Self-correction：Opus 4.7 自检更强，报告结果前更倾向于验证自己的输出。如果生成代码反复出错，可以尝试切换到 Opus。
Session endurance：长 spec 或大型重构中，Opus 更能保持上下文焦点；Haiku 和 Sonnet 更适合短而明确的互动。
Initiative level：Opus 更容易主动扩大修改范围，Sonnet 通常更贴近你的明确要求。需要“模型带着走”选 Opus，需要“严格跟指令”选 Sonnet。

模型生命周期

Kiro 中的 models 有两个阶段：

Stage	说明
Experimental	供早期测试，可能根据反馈变化，通常 region availability 有限制
Active	完整支持，推荐生产使用，在支持区域内可用性更稳定

发布日期

Model	Launched	Status
Claude Opus 4.7	April 16, 2026	Experimental
GLM-5	March 31, 2026	Experimental
MiniMax M2.5	March 18, 2026	Experimental
Claude Sonnet 4.6	February 17, 2026	Active
DeepSeek 3.2	February 10, 2026	Experimental
MiniMax M2.1	February 10, 2026	Experimental
Qwen3 Coder Next	February 10, 2026	Experimental
Claude Opus 4.6	February 5, 2026	Active
Claude Opus 4.5	November 24, 2025	Active
Claude Sonnet 4.5	September 29, 2025	Active
Auto	September 17, 2025	Active
Claude Sonnet 4.0	September 4, 2025	Active
Claude Haiku 4.5	September 4, 2025	Active

最佳实践

日常开发从 Auto 开始，让 Kiro 自动平衡质量与成本。
遇到复杂问题、跨文件重构、大型 spec 或调试僵局时，再切到 Opus。
小改动、快速验证、批量轻任务优先使用 Haiku 或低成本 open weight models。
定期在 account settings 查看使用量，理解模型选择对 credits 的影响。
如果团队主要使用 Opus，评估 Pro+ 或 Power 是否更适合，详见 plans and billing。

常见问题

Auto 会不会选到不够强的模型？

Auto 的目标是质量和成本平衡。大多数日常开发足够使用；如果你明确需要深度推理、长上下文和更强自检，可以手动切换到 Opus。

企业团队应该统一指定一个默认模型吗？

可以为关键流程指定默认模型，例如代码审查用 Sonnet、复杂设计用 Opus。但不建议所有任务都固定最贵模型，否则 credits 消耗会很难控制。

Experimental 模型可以用于生产代码吗？

可以试用，但要更严格地做 review 和测试。Experimental 代表模型或可用性仍可能变化，不适合作为企业关键流程的唯一依赖。

Kiro CLI models：按任务选择质量、速度与成本的平衡点 #

快速对比 #

如何切换模型 #

应该选哪个模型 #

模型可用性 #

主要模型说明 #

Auto（推荐默认） #

Claude Opus 4.7 #

Claude Opus 4.6 / 4.5 #

Claude Sonnet 4.6 / 4.5 / 4.0 #

Claude Haiku 4.5 #

Open weight models #

模型行为差异 #

模型生命周期 #

发布日期 #

最佳实践 #

常见问题 #

Auto 会不会选到不够强的模型？ #

企业团队应该统一指定一个默认模型吗？ #

Experimental 模型可以用于生产代码吗？ #