Skip to content

使用 SenseAudio 为 OpenClaw 入站语音消息提供批量语音转文字,将音频附件转为 {{Transcript}} 文本插入对话。需先设置 SENSEAUDIO_API_KEY 环境变量,然后在 tools.media.audio 配置中启用 senseaudio provider 并指定模型 ID。SenseAudio 仅支持批量 STT,不支持实时语音对话转录。

OpenClaw SenseAudio 语音转文字配置与 API Key 设置

SenseAudio 通过 OpenClaw 统一的 tools.media.audio 音频管道,将入站语音消息和音频附件转录为文字。OpenClaw 将 multipart 音频发送到兼容 OpenAI 的转录端点,返回的文字会作为 {{Transcript}} 插入对话,同时附带一个 [Audio] 块。

属性
Provider idsenseaudio
插件类型内置,enabledByDefault: true
合约类型mediaUnderstandingProviders (audio)
认证环境变量SENSEAUDIO_API_KEY
默认模型senseaudio-asr-pro-1.5-260319
默认端点https://api.senseaudio.cn/v1
官网senseaudio.cn
文档senseaudio.cn/docs

接入步骤

设置 API Key

```bash
export SENSEAUDIO_API_KEY="你的API密钥"
```

启用音频 Provider

在 OpenClaw 配置中启用 SenseAudio 作为音频转录 provider:
```json5
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "senseaudio", model: "senseaudio-asr-pro-1.5-260319" }],
      },
    },
  },
}
```

发送语音消息

通过任意已连接的渠道发送音频消息。OpenClaw 会自动将音频上传到 SenseAudio 进行转录,并将结果用于回复流程。

配置选项

选项路径说明
modeltools.media.audio.models[].modelSenseAudio ASR 模型 ID
languagetools.media.audio.models[].language可选的语言提示
prompttools.media.audio.prompt可选的转录提示词
baseUrltools.media.audio.baseUrl 或 model 中覆盖 OpenAI 兼容端点
headerstools.media.audio.request.headers额外的请求头

INFO

SenseAudio 在 OpenClaw 中仅支持批量 STT。实时语音对话的转录仍由支持流式 STT 的 provider 处理。

相关资料

常见问题

OpenClaw 怎么配置 SenseAudio 语音转文字?

设置环境变量 SENSEAUDIO_API_KEY,然后在 tools.media.audio 配置中设置 enabled: true,并在 models 数组里指定 provider: "senseaudio" 和对应模型 ID。之后在任意渠道发送语音消息即可自动转录。

需要设置哪些环境变量?

唯一必须的环境变量是 SENSEAUDIO_API_KEY。如果使用自定义端点,可通过 tools.media.audio.baseUrl 或模型中的 baseUrl 覆盖。

SenseAudio 支持哪些语音语言?

通过 tools.media.audio.models[].language 可选指定语言提示。具体支持的语言列表可查阅 SenseAudio 官方文档