使用 SenseAudio 为 OpenClaw 入站语音消息提供批量语音转文字，将音频附件转为 {{Transcript}} 文本插入对话。需先设置 SENSEAUDIO_API_KEY 环境变量，然后在 tools.media.audio 配置中启用 senseaudio provider 并指定模型 ID。SenseAudio 仅支持批量 STT，不支持实时语音对话转录。

OpenClaw SenseAudio 语音转文字配置与 API Key 设置

SenseAudio 通过 OpenClaw 统一的 tools.media.audio 音频管道，将入站语音消息和音频附件转录为文字。OpenClaw 将 multipart 音频发送到兼容 OpenAI 的转录端点，返回的文字会作为 {{Transcript}} 插入对话，同时附带一个 [Audio] 块。

属性	值
Provider id	`senseaudio`
插件类型	内置，`enabledByDefault: true`
合约类型	`mediaUnderstandingProviders` (audio)
认证环境变量	`SENSEAUDIO_API_KEY`
默认模型	`senseaudio-asr-pro-1.5-260319`
默认端点	`https://api.senseaudio.cn/v1`
官网	senseaudio.cn
文档	senseaudio.cn/docs

接入步骤

设置 API Key

```bash
export SENSEAUDIO_API_KEY="你的API密钥"
```

启用音频 Provider

在 OpenClaw 配置中启用 SenseAudio 作为音频转录 provider：
```json5
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "senseaudio", model: "senseaudio-asr-pro-1.5-260319" }],
      },
    },
  },
}
```

发送语音消息

通过任意已连接的渠道发送音频消息。OpenClaw 会自动将音频上传到 SenseAudio 进行转录，并将结果用于回复流程。

配置选项

选项	路径	说明
`model`	`tools.media.audio.models[].model`	SenseAudio ASR 模型 ID
`language`	`tools.media.audio.models[].language`	可选的语言提示
`prompt`	`tools.media.audio.prompt`	可选的转录提示词
`baseUrl`	`tools.media.audio.baseUrl` 或 model 中	覆盖 OpenAI 兼容端点
`headers`	`tools.media.audio.request.headers`	额外的请求头

::: info SenseAudio 在 OpenClaw 中仅支持批量 STT。实时语音对话的转录仍由支持流式 STT 的 provider 处理。 :::

常见问题

OpenClaw 怎么配置 SenseAudio 语音转文字？

设置环境变量 SENSEAUDIO_API_KEY，然后在 tools.media.audio 配置中设置 enabled: true，并在 models 数组里指定 provider: "senseaudio" 和对应模型 ID。之后在任意渠道发送语音消息即可自动转录。

需要设置哪些环境变量？

唯一必须的环境变量是 SENSEAUDIO_API_KEY。如果使用自定义端点，可通过 tools.media.audio.baseUrl 或模型中的 baseUrl 覆盖。

SenseAudio 支持哪些语音语言？

通过 tools.media.audio.models[].language 可选指定语言提示。具体支持的语言列表可查阅 SenseAudio 官方文档。

OpenClaw SenseAudio 语音转文字配置与 API Key 设置 #

接入步骤 #

配置选项 #

相关资料 #

常见问题 #

OpenClaw 怎么配置 SenseAudio 语音转文字？ #

需要设置哪些环境变量？ #

SenseAudio 支持哪些语音语言？ #