Skip to content

图片生成

image_generate 工具让 Agent 通过配置好的 Provider 生成和编辑图片,生成结果自动以媒体附件形式发送到对话中。

只有在至少一个图片生成 Provider 可用时,该工具才会出现在 Agent 的工具列表中。如果看不到 image_generate,请配置 agents.defaults.imageGenerationModel 或设置 Provider 的 API Key。

快速开始

  1. 为至少一个 Provider 设置 API Key(如 OPENAI_API_KEYGEMINI_API_KEY
  2. 可选:设置首选模型:
json5
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
      },
    },
  },
}
  1. 让 Agent 生成图片:"生成一只友好的龙虾吉祥物图片。"

Agent 自动调用 image_generate,无需手动开启工具权限。

支持的 Provider

Provider默认模型编辑支持API Key
OpenAIgpt-image-1是(最多 5 张)OPENAI_API_KEY
Googlegemini-3.1-flash-image-previewGEMINI_API_KEYGOOGLE_API_KEY
falfal-ai/flux/devFAL_KEY
MiniMaximage-01是(主题参考)MINIMAX_API_KEY 或 MiniMax OAuth
ComfyUIworkflow是(1 张,workflow 定义)COMFY_API_KEYCOMFY_CLOUD_API_KEY
Vydragrok-imagineVYDRA_API_KEY

运行时查看可用 Provider:

/tool image_generate action=list

工具参数

参数类型说明
promptstring图片生成提示词(action: "generate" 时必填)
actionstring"generate"(默认)或 "list" 查看 Provider 列表
modelstring覆盖 Provider/模型,如 openai/gpt-image-1
imagestring编辑模式参考图路径或 URL(单张)
imagesstring[]编辑模式参考图(多张,最多 5 张)
sizestring尺寸提示:1024x10241536x10241024x15361024x17921792x1024
aspectRatiostring宽高比:1:12:33:29:1616:9
resolutionstring分辨率提示:1K2K4K
countnumber生成张数(1-4)
filenamestring输出文件名提示

不同 Provider 支持的参数不同,不支持的参数会被忽略,结果中会报告被丢弃的覆盖项。

配置

模型选择与 fallback

json5
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-1",
        fallbacks: ["google/gemini-3.1-flash-image-preview", "fal/fal-ai/flux/dev"],
      },
    },
  },
}

Provider 选择顺序

OpenClaw 按以下顺序选择 Provider:

  1. 工具调用中的 model 参数(Agent 明确指定时)
  2. 配置中的 imageGenerationModel.primary
  3. imageGenerationModel.fallbacks 中的依次尝试
  4. 自动检测:按已认证 Provider 的注册顺序依次尝试

某个 Provider 失败(鉴权错误、限速等)时自动切换下一个,全部失败时返回每次尝试的详细错误。

图片编辑

OpenAI、Google、fal、MiniMax 和 ComfyUI 支持参考图片编辑:

"把这张照片改成水彩风格" + image: "/path/to/photo.jpg"

OpenAI 和 Google 通过 images 参数支持最多 5 张参考图;fal、MiniMax 和 ComfyUI 各支持 1 张。

MiniMax 图片生成同时支持两种接入方式:

  • minimax/image-01:API Key 接入
  • minimax-portal/image-01:OAuth 接入

Provider 能力对比

能力OpenAIGooglefalMiniMaxComfyUIVydra
生成张数最多 4 张最多 4 张最多 4 张最多 9 张workflow 决定1 张
编辑/参考图最多 5 张最多 5 张1 张1 张(主题参考)1 张(workflow)不支持
尺寸控制
宽高比仅生成模式
分辨率(1K/2K/4K)

延伸阅读