Appearance
使用 SenseAudio 为 OpenClaw 入站语音消息提供批量语音转文字,将音频附件转为 {{Transcript}} 文本插入对话。需先设置 SENSEAUDIO_API_KEY 环境变量,然后在 tools.media.audio 配置中启用 senseaudio provider 并指定模型 ID。SenseAudio 仅支持批量 STT,不支持实时语音对话转录。
OpenClaw SenseAudio 语音转文字配置与 API Key 设置
SenseAudio 通过 OpenClaw 统一的 tools.media.audio 音频管道,将入站语音消息和音频附件转录为文字。OpenClaw 将 multipart 音频发送到兼容 OpenAI 的转录端点,返回的文字会作为 {{Transcript}} 插入对话,同时附带一个 [Audio] 块。
| 属性 | 值 |
|---|---|
| Provider id | senseaudio |
| 插件类型 | 内置,enabledByDefault: true |
| 合约类型 | mediaUnderstandingProviders (audio) |
| 认证环境变量 | SENSEAUDIO_API_KEY |
| 默认模型 | senseaudio-asr-pro-1.5-260319 |
| 默认端点 | https://api.senseaudio.cn/v1 |
| 官网 | senseaudio.cn |
| 文档 | senseaudio.cn/docs |
接入步骤
设置 API Key
```bash
export SENSEAUDIO_API_KEY="你的API密钥"
```
启用音频 Provider
在 OpenClaw 配置中启用 SenseAudio 作为音频转录 provider:
```json5
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "senseaudio", model: "senseaudio-asr-pro-1.5-260319" }],
},
},
},
}
```
发送语音消息
通过任意已连接的渠道发送音频消息。OpenClaw 会自动将音频上传到 SenseAudio 进行转录,并将结果用于回复流程。
配置选项
| 选项 | 路径 | 说明 |
|---|---|---|
model | tools.media.audio.models[].model | SenseAudio ASR 模型 ID |
language | tools.media.audio.models[].language | 可选的语言提示 |
prompt | tools.media.audio.prompt | 可选的转录提示词 |
baseUrl | tools.media.audio.baseUrl 或 model 中 | 覆盖 OpenAI 兼容端点 |
headers | tools.media.audio.request.headers | 额外的请求头 |
INFO
SenseAudio 在 OpenClaw 中仅支持批量 STT。实时语音对话的转录仍由支持流式 STT 的 provider 处理。
相关资料
常见问题
OpenClaw 怎么配置 SenseAudio 语音转文字?
设置环境变量 SENSEAUDIO_API_KEY,然后在 tools.media.audio 配置中设置 enabled: true,并在 models 数组里指定 provider: "senseaudio" 和对应模型 ID。之后在任意渠道发送语音消息即可自动转录。
需要设置哪些环境变量?
唯一必须的环境变量是 SENSEAUDIO_API_KEY。如果使用自定义端点,可通过 tools.media.audio.baseUrl 或模型中的 baseUrl 覆盖。
SenseAudio 支持哪些语音语言?
通过 tools.media.audio.models[].language 可选指定语言提示。具体支持的语言列表可查阅 SenseAudio 官方文档。