Appearance
Kiro CLI 图片理解功能允许你在终端 chat 中直接讨论截图、设计图和架构图。你可以拖拽图片到终端、描述图片路径,或用 /paste 粘贴剪贴板图片,让 Kiro 分析错误截图、UI 设计或技术图表。
Kiro CLI 图片理解:在 Chat 中分析截图、设计图和架构图
Kiro CLI 可以在 chat session 中分析图片。对 AI 编程来说,这个功能很适合处理“文字描述不如截图直观”的场景,例如报错截图、UI 草图、架构图、流程图等。
它和 IDE 中的视觉上下文类似,但入口在终端里:你把图片路径或剪贴板图片交给 Kiro,再说明你希望它做什么。
拖拽图片到终端
最简单的方式是把图片直接拖进终端窗口。拖拽后通常会发生三件事:
- 图片路径会自动插入到 prompt 中。
- 你可以继续补充文字,说明要分析什么。
- Kiro 会读取图片内容并基于图像回答。
示例:
text
Kiro> /path/to/architecture-diagram.png Can you explain this architecture and generate sample code for implementing it?实际使用时,建议把问题说具体,例如“解释模块边界”“找出 UI 信息层级问题”“把流程图转成伪代码”。
用 fs_read 读取图片
你也可以直接在 prompt 中描述图片路径:
text
Kiro> Can you analyze this screenshot at /path/to/screenshot.png?当 Kiro 识别到图片文件时,会建议使用 fs_read 的 Image mode。这个方式适合你已经知道图片路径,或者需要分析项目目录中的截图文件。
粘贴剪贴板图片
如果图片已经在系统剪贴板中,可以使用:
text
/paste这适合临时截屏后直接发给 Kiro 分析,尤其是排查终端报错、浏览器页面异常或 UI 布局问题时。
常见使用场景
Kiro CLI 图片理解适合这些任务:
- 分析错误截图并给出排障方向。
- 把架构图转成实现计划或示例代码。
- 讨论 UI/UX 设计并生成 HTML/CSS。
- 理解流程图并转换成算法步骤。
- 审查图片形式的代码片段。
- 解读技术图表并整理成文档。
如果图片中包含敏感信息,例如 token、客户数据、内部域名,发送前应先打码。
支持格式和限制
支持的图片格式包括:
- JPEG/JPG
- PNG
- GIF
- WebP
限制:
- 单张图片必须小于 10MB。
- 单次请求最多分享 10 张图片。
为了获得更好结果:
- 使用清晰、高分辨率图片。
- 如果图片里有文字,确保文字可读。
- 明确说明你希望 Kiro 从图片中提取什么。
- 对复杂图表补充业务背景,避免 agent 只按视觉结构猜测含义。
常见问题
Q: Kiro CLI 能看截图吗?
A: 可以。你可以拖拽截图到终端、提供图片路径,或用 /paste 粘贴剪贴板图片。
Q: Kiro CLI 支持哪些图片格式?
A: 支持 JPEG/JPG、PNG、GIF 和 WebP,单张图片需小于 10MB。
Q: 可以一次给 Kiro 多张图片吗?
A: 可以,单次请求最多 10 张。复杂对比任务建议说明每张图的作用。