Appearance
小米 MiMo 模型通过 OpenClaw 的 bundled xiaomi 插件接入,只需设置 XIAOMI_API_KEY 环境变量或通过 openclaw onboard 向导配置。支持 chat completions 和 TTS,提供 Flash、Pro、Omni 三款模型,默认使用 xiaomi/mimo-v2-flash。若模型不出现,检查环境变量是否对 daemon 进程可用;使用 ~/.openclaw/.env 或 env.shellEnv 可持久化。
OpenClaw 小米 MiMo 模型接入指南
小米 MiMo 是面向 MiMo 系列模型的 API 平台。OpenClaw 的 xiaomi 插件默认启用,同时注册了一个 OpenAI 兼容的聊天提供商和一个 TTS(语音合成)提供商,共用同一个 XIAOMI_API_KEY。
| 属性 | 值 |
|---|---|
| Provider id | xiaomi |
| 插件类型 | 内置,默认启用 (enabledByDefault: true) |
| 认证环境变量 | XIAOMI_API_KEY |
| 引导配置参数 | --auth-choice xiaomi-api-key |
| 直接 CLI 参数 | --xiaomi-api-key <key> |
| 合约 | chat completions + speechProviders |
| API | OpenAI 兼容 (openai-completions) |
| Base URL | https://api.xiaomimimo.com/v1 |
| 默认模型 | xiaomi/mimo-v2-flash |
| 默认 TTS 模型 | mimo-v2.5-tts,语音 mimo_default |
快速开始
获取 API Key
在 [小米 MiMo 控制台](https://platform.xiaomimimo.com/#/console/api-keys) 创建 API Key。
运行 onboard 向导
```bash
openclaw onboard --auth-choice xiaomi-api-key
```
或者直接传入 Key:
```bash
openclaw onboard --auth-choice xiaomi-api-key --xiaomi-api-key "$XIAOMI_API_KEY"
```
验证模型是否可用
```bash
openclaw models list --provider xiaomi
```
内置模型列表
| 模型引用 | 输入 | 上下文 | 最大输出 | 推理 | 备注 |
|---|---|---|---|---|---|
xiaomi/mimo-v2-flash | text | 262,144 | 8,192 | 否 | 默认模型 |
xiaomi/mimo-v2-pro | text | 1,048,576 | 32,000 | 是 | 长上下文 |
xiaomi/mimo-v2-omni | text, image | 262,144 | 32,000 | 是 | 多模态 |
TIP
默认模型引用为 xiaomi/mimo-v2-flash。当 XIAOMI_API_KEY 已设置或存在认证文件时,提供商会自动注入,无需手动配置。
语音合成(TTS)
xiaomi 插件同时将小米 MiMo 注册为语音提供商,可用于 messages.tts。它通过小米的 chat-completions TTS 合约,将文本作为 assistant 消息发送,可选的语气指导作为 user 消息。
| 属性 | 值 |
|---|---|
| TTS 标识符 | xiaomi(别名 mimo) |
| 认证 | XIAOMI_API_KEY |
| API | POST /v1/chat/completions 带 audio 参数 |
| 默认 | mimo-v2.5-tts,语音 mimo_default |
| 输出 | 默认 MP3;配置后可输出 WAV |
json5
{
messages: {
tts: {
auto: "always",
provider: "xiaomi",
providers: {
xiaomi: {
apiKey: "xiaomi_api_key",
model: "mimo-v2.5-tts",
voice: "mimo_default",
format: "mp3",
style: "Bright, natural, conversational tone.",
},
},
},
},
}内置支持的语音包括 mimo_default、default_zh、default_en、Mia、Chloe、Milo、Dean。mimo-v2-tts 适用于旧版 MiMo TTS 账户;默认使用当前 MiMo-V2.5 TTS 模型。对于飞书和 Telegram 等语音消息目标,OpenClaw 会通过 ffmpeg 将输出转码为 48kHz Opus 格式。
配置示例
json5
{
env: { XIAOMI_API_KEY: "your-key" },
agents: { defaults: { model: { primary: "xiaomi/mimo-v2-flash" } } },
models: {
mode: "merge",
providers: {
xiaomi: {
baseUrl: "https://api.xiaomimimo.com/v1",
api: "openai-completions",
apiKey: "XIAOMI_API_KEY",
models: [
{
id: "mimo-v2-flash",
name: "Xiaomi MiMo V2 Flash",
reasoning: false,
input: ["text"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 262144,
maxTokens: 8192,
},
{
id: "mimo-v2-pro",
name: "Xiaomi MiMo V2 Pro",
reasoning: true,
input: ["text"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 1048576,
maxTokens: 32000,
},
{
id: "mimo-v2-omni",
name: "Xiaomi MiMo V2 Omni",
reasoning: true,
input: ["text", "image"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 262144,
maxTokens: 32000,
},
],
},
},
},
}自动注入行为
当环境中设置了 `XIAOMI_API_KEY` 或存在认证文件,`xiaomi` 提供商会自动注入。除非需要覆盖模型元数据或 base URL,否则无需手动配置该提供商。
模型详情
- **mimo-v2-flash** — 轻量快速,适合通用文本任务,不支持推理。
- **mimo-v2-pro** — 支持推理,100 万 token 上下文窗口,适合长文档场景。
- **mimo-v2-omni** — 推理多模态模型,可接受文本和图片输入。
INFO
所有模型都使用 `xiaomi/` 前缀,例如 `xiaomi/mimo-v2-pro`。
故障排查
- 如果模型列表中没有显示小米模型,确认 `XIAOMI_API_KEY` 已设置且有效。
- 当 Gateway 以 daemon 方式运行时,确保 Key 对 daemon 进程可见(例如放在 `~/.openclaw/.env` 或通过 `env.shellEnv` 配置)。
WARNING
仅在交互式 shell 中设置的 Key,daemon 管理的 gateway 进程无法读取。请使用 `~/.openclaw/.env` 或 `env.shellEnv` 配置实现持久化。
相关文档
模型选择
提供商选择、模型引用和故障转移行为。
配置参考
完整的 OpenClaw 配置参考。
小米 MiMo 控制台
小米 MiMo 仪表盘与 API Key 管理。
常见问题
为什么配置了 XIAOMI_API_KEY 但 openclaw models list 看不到小米模型?
确认 Key 是否有效,且环境变量对当前 Gateway 进程可见。如果 Gateway 以 daemon 运行,需要将 Key 写入 ~/.openclaw/.env 文件,或通过 env.shellEnv 配置,仅交互式 shell 设置的 Key 不会被继承。
小米 MiMo 的 TTS 功能怎么在 OpenClaw 中使用?
在消息配置的 messages.tts 中设置 provider: "xiaomi",并指定模型、语音和格式。默认使用 mimo-v2.5-tts 和 mimo_default 语音。输出支持 MP3 和 WAV,飞书/Telegram 等目标会自动转码为 48kHz Opus。
mimo-v2-pro 的上下文窗口有多大?支持什么输入类型?
mimo-v2-pro 的上下文窗口为 1,048,576 token(约 100 万),最大输出 32,000 token,支持推理。输入只接受文本,不支持图片。引用时需要加上 xiaomi/ 前缀。