Skip to content

Kiro CLI 图片理解功能允许你在终端 chat 中直接讨论截图、设计图和架构图。你可以拖拽图片到终端、描述图片路径,或用 /paste 粘贴剪贴板图片,让 Kiro 分析错误截图、UI 设计或技术图表。

Kiro CLI 图片理解:在 Chat 中分析截图、设计图和架构图

Kiro CLI 可以在 chat session 中分析图片。对 AI 编程来说,这个功能很适合处理“文字描述不如截图直观”的场景,例如报错截图、UI 草图、架构图、流程图等。

它和 IDE 中的视觉上下文类似,但入口在终端里:你把图片路径或剪贴板图片交给 Kiro,再说明你希望它做什么。

拖拽图片到终端

最简单的方式是把图片直接拖进终端窗口。拖拽后通常会发生三件事:

  1. 图片路径会自动插入到 prompt 中。
  2. 你可以继续补充文字,说明要分析什么。
  3. Kiro 会读取图片内容并基于图像回答。

示例:

text
Kiro> /path/to/architecture-diagram.png Can you explain this architecture and generate sample code for implementing it?

实际使用时,建议把问题说具体,例如“解释模块边界”“找出 UI 信息层级问题”“把流程图转成伪代码”。

用 fs_read 读取图片

你也可以直接在 prompt 中描述图片路径:

text
Kiro> Can you analyze this screenshot at /path/to/screenshot.png?

当 Kiro 识别到图片文件时,会建议使用 fs_read 的 Image mode。这个方式适合你已经知道图片路径,或者需要分析项目目录中的截图文件。

粘贴剪贴板图片

如果图片已经在系统剪贴板中,可以使用:

text
/paste

这适合临时截屏后直接发给 Kiro 分析,尤其是排查终端报错、浏览器页面异常或 UI 布局问题时。

常见使用场景

Kiro CLI 图片理解适合这些任务:

  • 分析错误截图并给出排障方向。
  • 把架构图转成实现计划或示例代码。
  • 讨论 UI/UX 设计并生成 HTML/CSS。
  • 理解流程图并转换成算法步骤。
  • 审查图片形式的代码片段。
  • 解读技术图表并整理成文档。

如果图片中包含敏感信息,例如 token、客户数据、内部域名,发送前应先打码。

支持格式和限制

支持的图片格式包括:

  • JPEG/JPG
  • PNG
  • GIF
  • WebP

限制:

  • 单张图片必须小于 10MB。
  • 单次请求最多分享 10 张图片。

为了获得更好结果:

  • 使用清晰、高分辨率图片。
  • 如果图片里有文字,确保文字可读。
  • 明确说明你希望 Kiro 从图片中提取什么。
  • 对复杂图表补充业务背景,避免 agent 只按视觉结构猜测含义。

常见问题

Q: Kiro CLI 能看截图吗?

A: 可以。你可以拖拽截图到终端、提供图片路径,或用 /paste 粘贴剪贴板图片。

Q: Kiro CLI 支持哪些图片格式?

A: 支持 JPEG/JPG、PNG、GIF 和 WebP,单张图片需小于 10MB。

Q: 可以一次给 Kiro 多张图片吗?

A: 可以,单次请求最多 10 张。复杂对比任务建议说明每张图的作用。