图片生成

image_generate 工具让 Agent 通过配置好的 Provider 生成和编辑图片，生成结果自动以媒体附件形式发送到对话中。

只有在至少一个图片生成 Provider 可用时，该工具才会出现在 Agent 的工具列表中。如果看不到 image_generate，请配置 agents.defaults.imageGenerationModel 或设置 Provider 的 API Key。

快速开始

为至少一个 Provider 设置 API Key（如 OPENAI_API_KEY 或 GEMINI_API_KEY）
可选：设置首选模型：

json5

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
      },
    },
  },
}

让 Agent 生成图片："生成一只友好的龙虾吉祥物图片。"

Agent 自动调用 image_generate，无需手动开启工具权限。

支持的 Provider

Provider	默认模型	编辑支持	API Key
OpenAI	`gpt-image-1`	是（最多 5 张）	`OPENAI_API_KEY`
Google	`gemini-3.1-flash-image-preview`	是	`GEMINI_API_KEY` 或 `GOOGLE_API_KEY`
fal	`fal-ai/flux/dev`	是	`FAL_KEY`
MiniMax	`image-01`	是（主题参考）	`MINIMAX_API_KEY` 或 MiniMax OAuth
ComfyUI	`workflow`	是（1 张，workflow 定义）	`COMFY_API_KEY` 或 `COMFY_CLOUD_API_KEY`
Vydra	`grok-imagine`	否	`VYDRA_API_KEY`

运行时查看可用 Provider：

/tool image_generate action=list

工具参数

参数	类型	说明
`prompt`	string	图片生成提示词（`action: "generate"` 时必填）
`action`	string	`"generate"`（默认）或 `"list"` 查看 Provider 列表
`model`	string	覆盖 Provider/模型，如 `openai/gpt-image-1`
`image`	string	编辑模式参考图路径或 URL（单张）
`images`	string[]	编辑模式参考图（多张，最多 5 张）
`size`	string	尺寸提示：`1024x1024`、`1536x1024`、`1024x1536`、`1024x1792`、`1792x1024`
`aspectRatio`	string	宽高比：`1:1`、`2:3`、`3:2`、`9:16`、`16:9` 等
`resolution`	string	分辨率提示：`1K`、`2K` 或 `4K`
`count`	number	生成张数（1-4）
`filename`	string	输出文件名提示

不同 Provider 支持的参数不同，不支持的参数会被忽略，结果中会报告被丢弃的覆盖项。

配置

模型选择与 fallback

json5

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

Provider 选择顺序

OpenClaw 按以下顺序选择 Provider：

工具调用中的 model 参数（Agent 明确指定时）
配置中的 imageGenerationModel.primary
imageGenerationModel.fallbacks 中的依次尝试
自动检测：按已认证 Provider 的注册顺序依次尝试

某个 Provider 失败（鉴权错误、限速等）时自动切换下一个，全部失败时返回每次尝试的详细错误。

图片编辑

OpenAI、Google、fal、MiniMax 和 ComfyUI 支持参考图片编辑：

"把这张照片改成水彩风格" + image: "/path/to/photo.jpg"

OpenAI 和 Google 通过 images 参数支持最多 5 张参考图；fal、MiniMax 和 ComfyUI 各支持 1 张。

MiniMax 图片生成同时支持两种接入方式：

minimax/image-01：API Key 接入
minimax-portal/image-01：OAuth 接入

Provider 能力对比

能力	OpenAI	Google	fal	MiniMax	ComfyUI	Vydra
生成张数	最多 4 张	最多 4 张	最多 4 张	最多 9 张	workflow 决定	1 张
编辑/参考图	最多 5 张	最多 5 张	1 张	1 张（主题参考）	1 张（workflow）	不支持
尺寸控制	是	是	是	否	否	否
宽高比	否	是	仅生成模式	是	否	否
分辨率（1K/2K/4K）	否	是	是	否	否	否

图片生成 ​

快速开始 ​

支持的 Provider ​

工具参数 ​

配置 ​

模型选择与 fallback ​

Provider 选择顺序 ​

图片编辑 ​

Provider 能力对比 ​

延伸阅读 ​