Appearance
Kiro CLI 提供 Auto、Claude、DeepSeek、MiniMax、GLM、Qwen 等多类 models。选择模型时不要只看“最强”,还要同时考虑上下文窗口、credit 成本、region、订阅层级和任务复杂度。多数日常开发从 Auto 开始即可。
Kiro CLI models:按任务选择质量、速度与成本的平衡点
Kiro CLI 可以访问 frontier models 和 open weight models。不同模型的优势不一样:有的适合长上下文架构设计,有的适合快速修改,有的适合低成本长会话。对团队来说,合理的模型策略能同时控制质量、速度和 credits 消耗。
如果你不确定怎么选,先用 Auto。Auto 会根据任务自动路由,在质量和成本之间做平衡。
快速对比
| Model | Context window | Cost | Region | Free | Pro | Pro+ | Power | Auth |
|---|---|---|---|---|---|---|---|---|
| Claude Opus 4.7 | 1M | 2.2x | us-east-1, eu-central-1 | ✓ | ✓ | ✓ | IDC | |
| Claude Opus 4.6 | 1M | 2.2x | us-east-1, eu-central-1 | ✓ | ✓ | ✓ | All | |
| Claude Opus 4.5 | 200K | 2.2x | us-east-1, eu-central-1 | ✓ | ✓ | ✓ | All | |
| Claude Sonnet 4.6 | 1M | 1.3x | us-east-1, eu-central-1 | ✓ | ✓ | ✓ | All | |
| Claude Sonnet 4.5 | 200K | 1.3x | us-east-1, eu-central-1 | ✓ | ✓ | ✓ | ✓ | All |
| Claude Sonnet 4.0 | 200K | 1.3x | us-east-1, eu-central-1 | ✓ | ✓ | ✓ | ✓ | All |
| Auto | 1.0x | us-east-1, eu-central-1 | ✓ | ✓ | ✓ | ✓ | All | |
| Claude Haiku 4.5 | 200K | 0.4x | us-east-1, eu-central-1 | ✓ | ✓ | ✓ | All | |
| DeepSeek 3.2 | 128K | 0.25x | us-east-1 | ✓ | ✓ | ✓ | ✓ | All |
| MiniMax M2.5 | 200K | 0.25x | us-east-1, eu-central-1 | ✓ | ✓ | ✓ | ✓ | All |
| GLM-5 | 200K | 0.5x | us-east-1 | ✓ | ✓ | ✓ | ✓ | All |
| MiniMax M2.1 | 200K | 0.15x | us-east-1, eu-central-1 | ✓ | ✓ | ✓ | ✓ | All |
| Qwen3 Coder Next | 256K | 0.05x | us-east-1, eu-central-1 | ✓ | ✓ | ✓ | ✓ | All |
Cost 以 Auto 的 1.0x 为基准。例如,一个任务在 Auto 下消耗 10 credits,使用 Opus 可能消耗 22 credits,使用 Haiku 约 4 credits,使用 Qwen3 Coder Next 约 0.5 credits。
如何切换模型
可以在 chat interface 的 model dropdown 中选择,也可以用命令设置默认模型:
bash
kiro-cli settings chat.defaultModel claude-opus-4.7如果某个模型没有出现在下拉列表中,先重启客户端。模型可见性可能受订阅、region、auth 方式和灰度发布影响。
在当前会话中选好模型后,也可以把它保存为未来所有 session 的默认模型:
text
> /model set-current-as-default该偏好会写入:
text
~/.kiro/settings/cli.json之后新 session 会自动使用这个默认模型。
应该选哪个模型
| 场景 | 推荐模型 | 原因 |
|---|---|---|
| 通用开发 | Auto | 自动为每个任务路由合适模型,兼顾质量和成本 |
| 可预测基线 | Sonnet 4.0 | 没有路由层,每次都是同一模型,行为更稳定 |
| 强 agentic coding | Sonnet 4.5 | 规划、长时间自主执行和 tool usage 更强 |
| 高智力但更高效 | Sonnet 4.6 | 接近 Opus 智能,token 效率和指令遵循更好 |
| 大型代码库或长 spec | Opus 4.7 | 更强 agentic coding、自检和复杂指令遵循 |
| 大型代码库或长 spec | Opus 4.6 | 深度推理、跨大代码库规划和调试能力强 |
| 多系统复杂问题 | Opus 4.5 | 适合高歧义、高取舍的复杂软件工程问题 |
| 快速迭代或节省 credits | Haiku 4.5 | 速度快、成本低,适合小改动和子代理编排 |
| 低成本 coding | DeepSeek 3.2 | 适合 agentic workflow 和多步推理,成本较低 |
| 低成本前沿 coding | MiniMax M2.5 | 编码能力强,成本远低于高端模型 |
| 仓库级 agentic work | GLM-5 | 200K context,适合长周期跨文件工作 |
| 多语言编程 | MiniMax M2.1 | Rust、Go、C++、Kotlin、TypeScript 和 UI 生成表现较好 |
| 长时间 CLI coding | Qwen3 Coder Next | 256K context,错误恢复强,成本最低 |
实务建议:不要把 Opus 当默认模型无限使用。把它留给“Auto 或 Sonnet 已经卡住”的任务,通常更划算。
模型可用性
Model availability 会因 country、region、provider 要求和 Kiro 发布策略变化。Kiro 的模型供给会遵循各模型提供商对第三方服务和接口的使用条件。
如果某个模型不可用,检查以下因素:
- 当前账号订阅层级是否支持。
- 账号登录方式是否满足 Auth 要求,例如 IDC。
- 所在 region 是否支持该模型。
- 模型是否处于 Experimental 灰度阶段。
可参考各 provider 的支持区域说明,例如 Anthropic supported countries,以及 Qwen、DeepSeek、Kimi、MiniMax、GLM 的官方说明。
主要模型说明
Auto(推荐默认)
Auto 是 Kiro 的 model router,会组合多个 frontier models 和优化策略,为每个任务选择更合适的模型。它的目标不是永远选择最贵模型,而是在质量和成本之间达到较优平衡,通常能交付 Sonnet 4 级别的结果。
Claude Opus 4.7
Claude Opus 4.7 是 Anthropic 面向高难软件工程任务的最新高能力模型。它适合复杂、长时间、需要严格自检的 agentic work,也支持更高分辨率视觉输入,适合处理复杂截图和图表。目前在 us-east-1 和 eu-central-1 可用,并通过 cross-region inference 面向部分 AWS IAM Identity Center 用户滚动开放。更多信息见 Claude Opus 4.7。
Claude Opus 4.6 / 4.5
Opus 系列适合复杂架构、跨系统排障、长 spec 实现和高风险代码审查。它通常会在行动前做更深入规划,也更愿意发现并修正自己的错误。更多信息见 Claude Opus 4.6 和 Claude Opus 4.5。
Claude Sonnet 4.6 / 4.5 / 4.0
Sonnet 系列适合大多数专业开发任务。Sonnet 4.6 更接近 Opus 智能,同时更节省 token;Sonnet 4.5 在 agentic coding、工具使用和安全工程上表现强;Sonnet 4.0 适合需要固定模型、可预测行为的流程。更多信息见 Claude Sonnet 4.6、Claude Sonnet 4.5 和 Claude 4。
Claude Haiku 4.5
Haiku 4.5 适合快速迭代、简单修复、轻量 review 和子代理 orchestration。它成本低、速度快,并支持 extended thinking。更多信息见 Claude Haiku 4.5。
Open weight models
Kiro CLI 也提供多种 open weight models:
- MiniMax M2.5:低成本但 coding 能力强,适合完整开发生命周期。
- GLM-5:200K context,适合大仓库、多步骤工具调用和长期任务。
- DeepSeek 3.2:适合 agentic workflow、代码生成和多步推理。
- MiniMax M2.1:适合多语言编程和 UI generation。
- Qwen3 Coder Next:256K context,适合长 CLI coding session,credit 成本最低。
模型行为差异
理解模型行为比记住排行榜更有用。
- Planning depth:Opus 往往先想得更久,会考虑多步方案和边界情况;Sonnet 与 Haiku 更直接,启动更快。
- Self-correction:Opus 4.7 自检更强,报告结果前更倾向于验证自己的输出。如果生成代码反复出错,可以尝试切换到 Opus。
- Session endurance:长 spec 或大型重构中,Opus 更能保持上下文焦点;Haiku 和 Sonnet 更适合短而明确的互动。
- Initiative level:Opus 更容易主动扩大修改范围,Sonnet 通常更贴近你的明确要求。需要“模型带着走”选 Opus,需要“严格跟指令”选 Sonnet。
模型生命周期
Kiro 中的 models 有两个阶段:
| Stage | 说明 |
|---|---|
| Experimental | 供早期测试,可能根据反馈变化,通常 region availability 有限制 |
| Active | 完整支持,推荐生产使用,在支持区域内可用性更稳定 |
发布日期
| Model | Launched | Status |
|---|---|---|
| Claude Opus 4.7 | April 16, 2026 | Experimental |
| GLM-5 | March 31, 2026 | Experimental |
| MiniMax M2.5 | March 18, 2026 | Experimental |
| Claude Sonnet 4.6 | February 17, 2026 | Active |
| DeepSeek 3.2 | February 10, 2026 | Experimental |
| MiniMax M2.1 | February 10, 2026 | Experimental |
| Qwen3 Coder Next | February 10, 2026 | Experimental |
| Claude Opus 4.6 | February 5, 2026 | Active |
| Claude Opus 4.5 | November 24, 2025 | Active |
| Claude Sonnet 4.5 | September 29, 2025 | Active |
| Auto | September 17, 2025 | Active |
| Claude Sonnet 4.0 | September 4, 2025 | Active |
| Claude Haiku 4.5 | September 4, 2025 | Active |
最佳实践
- 日常开发从 Auto 开始,让 Kiro 自动平衡质量与成本。
- 遇到复杂问题、跨文件重构、大型 spec 或调试僵局时,再切到 Opus。
- 小改动、快速验证、批量轻任务优先使用 Haiku 或低成本 open weight models。
- 定期在 account settings 查看使用量,理解模型选择对 credits 的影响。
- 如果团队主要使用 Opus,评估 Pro+ 或 Power 是否更适合,详见 plans and billing。
常见问题
Auto 会不会选到不够强的模型?
Auto 的目标是质量和成本平衡。大多数日常开发足够使用;如果你明确需要深度推理、长上下文和更强自检,可以手动切换到 Opus。
企业团队应该统一指定一个默认模型吗?
可以为关键流程指定默认模型,例如代码审查用 Sonnet、复杂设计用 Opus。但不建议所有任务都固定最贵模型,否则 credits 消耗会很难控制。
Experimental 模型可以用于生产代码吗?
可以试用,但要更严格地做 review 和测试。Experimental 代表模型或可用性仍可能变化,不适合作为企业关键流程的唯一依赖。