Appearance
图片生成
image_generate 工具让 Agent 通过配置好的 Provider 生成和编辑图片,生成结果自动以媒体附件形式发送到对话中。
只有在至少一个图片生成 Provider 可用时,该工具才会出现在 Agent 的工具列表中。如果看不到
image_generate,请配置agents.defaults.imageGenerationModel或设置 Provider 的 API Key。
快速开始
- 为至少一个 Provider 设置 API Key(如
OPENAI_API_KEY或GEMINI_API_KEY) - 可选:设置首选模型:
json5
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openai/gpt-image-1",
},
},
},
}- 让 Agent 生成图片:"生成一只友好的龙虾吉祥物图片。"
Agent 自动调用 image_generate,无需手动开启工具权限。
支持的 Provider
| Provider | 默认模型 | 编辑支持 | API Key |
|---|---|---|---|
| OpenAI | gpt-image-1 | 是(最多 5 张) | OPENAI_API_KEY |
gemini-3.1-flash-image-preview | 是 | GEMINI_API_KEY 或 GOOGLE_API_KEY | |
| fal | fal-ai/flux/dev | 是 | FAL_KEY |
| MiniMax | image-01 | 是(主题参考) | MINIMAX_API_KEY 或 MiniMax OAuth |
| ComfyUI | workflow | 是(1 张,workflow 定义) | COMFY_API_KEY 或 COMFY_CLOUD_API_KEY |
| Vydra | grok-imagine | 否 | VYDRA_API_KEY |
运行时查看可用 Provider:
/tool image_generate action=list工具参数
| 参数 | 类型 | 说明 |
|---|---|---|
prompt | string | 图片生成提示词(action: "generate" 时必填) |
action | string | "generate"(默认)或 "list" 查看 Provider 列表 |
model | string | 覆盖 Provider/模型,如 openai/gpt-image-1 |
image | string | 编辑模式参考图路径或 URL(单张) |
images | string[] | 编辑模式参考图(多张,最多 5 张) |
size | string | 尺寸提示:1024x1024、1536x1024、1024x1536、1024x1792、1792x1024 |
aspectRatio | string | 宽高比:1:1、2:3、3:2、9:16、16:9 等 |
resolution | string | 分辨率提示:1K、2K 或 4K |
count | number | 生成张数(1-4) |
filename | string | 输出文件名提示 |
不同 Provider 支持的参数不同,不支持的参数会被忽略,结果中会报告被丢弃的覆盖项。
配置
模型选择与 fallback
json5
{
agents: {
defaults: {
imageGenerationModel: {
primary: "openai/gpt-image-1",
fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
},
},
},
}Provider 选择顺序
OpenClaw 按以下顺序选择 Provider:
- 工具调用中的
model参数(Agent 明确指定时) - 配置中的
imageGenerationModel.primary imageGenerationModel.fallbacks中的依次尝试- 自动检测:按已认证 Provider 的注册顺序依次尝试
某个 Provider 失败(鉴权错误、限速等)时自动切换下一个,全部失败时返回每次尝试的详细错误。
图片编辑
OpenAI、Google、fal、MiniMax 和 ComfyUI 支持参考图片编辑:
"把这张照片改成水彩风格" + image: "/path/to/photo.jpg"OpenAI 和 Google 通过 images 参数支持最多 5 张参考图;fal、MiniMax 和 ComfyUI 各支持 1 张。
MiniMax 图片生成同时支持两种接入方式:
minimax/image-01:API Key 接入minimax-portal/image-01:OAuth 接入
Provider 能力对比
| 能力 | OpenAI | fal | MiniMax | ComfyUI | Vydra | |
|---|---|---|---|---|---|---|
| 生成张数 | 最多 4 张 | 最多 4 张 | 最多 4 张 | 最多 9 张 | workflow 决定 | 1 张 |
| 编辑/参考图 | 最多 5 张 | 最多 5 张 | 1 张 | 1 张(主题参考) | 1 张(workflow) | 不支持 |
| 尺寸控制 | 是 | 是 | 是 | 否 | 否 | 否 |
| 宽高比 | 否 | 是 | 仅生成模式 | 是 | 否 | 否 |
| 分辨率(1K/2K/4K) | 否 | 是 | 是 | 否 | 否 | 否 |