Skip to content

Vydra

OpenClaw 内置 Vydra 插件,提供三种媒体生成能力:

  • 图片生成:vydra/grok-imagine
  • 视频生成:vydra/veo3(文生视频)、vydra/kling(图生视频)
  • 语音合成:由 ElevenLabs 后端支持

三种能力共用同一个 VYDRA_API_KEY

重要:Base URL 说明

请务必使用 https://www.vydra.ai/api/v1

https://vydra.ai/api/v1(无 www)会 301 重定向到 www,而部分 HTTP 客户端在跨主机重定向时会丢失 Authorization 头,导致明明有效的 API Key 报鉴权错误。内置插件已直接使用 www 地址规避此问题。

快速开始

bash
openclaw onboard --auth-choice vydra-api-key

或直接设置环境变量:

bash
export VYDRA_API_KEY="vydra_live_..."

图片生成

设置 Vydra 为默认图片 Provider:

json5
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "vydra/grok-imagine",
      },
    },
  },
}

当前内置支持纯文本生成图片。Vydra 托管的编辑接口需要远程图片 URL,目前插件尚未集成上传桥接。

视频生成

设置 Vydra 为默认视频 Provider:

json5
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "vydra/veo3",
      },
    },
  },
}

注意事项:

  • vydra/veo3:文生视频,无参考图片输入
  • vydra/kling:图生视频,需要远程图片 URL,不支持本地文件上传
  • 插件不转发宽高比、分辨率、水印、音频等附加参数

语音合成

设置 Vydra 为 TTS Provider:

json5
{
  messages: {
    tts: {
      provider: "vydra",
      providers: {
        vydra: {
          apiKey: "${VYDRA_API_KEY}",
          voiceId: "21m00Tcm4TlvDq8ikWAM",
        },
      },
    },
  },
}

默认使用 elevenlabs/tts 模型,返回 MP3 音频文件。

延伸阅读