Skip to content

将 LM Studio 作为本地模型后端接入 OpenClaw,支持桌面应用或 lms 无头守护进程。关键步骤:启动服务器(端口 1234)、可选设置 LM_API_TOKEN、运行 openclaw onboard 并选择 LM Studio;非交互式配置可用 --custom-base-url--custom-model-id 直接指定。OpenClaw 会自动处理流式推理 token 恢复和推理选项兼容,LAN/tailnet 端点默认信任。

OpenClaw 配置 LM Studio 本地模型接入

LM Studio 是一个友好的本地模型运行工具,支持 llama.cpp (GGUF) 和 MLX(Apple Silicon)模型。提供桌面 GUI 和无头守护进程 lms 两种运行方式。产品详情见 lmstudio.ai

快速开始

  1. 安装 LM Studio(桌面版)或无头守护进程 lms,然后启动本地服务器:
bash
curl -fsSL https://lmstudio.ai/install.sh | bash
  1. 启动服务器

启动桌面应用,或运行以下命令启动守护进程:

bash
lms daemon up
bash
lms server start --port 1234

如果使用桌面应用,建议启用 JIT 提升体验,详见 LM Studio JIT 与 TTL 指南

  1. 如果 LM Studio 启用了认证,设置环境变量 LM_API_TOKEN
bash
export LM_API_TOKEN="your-lm-studio-api-token"

如果未启用认证,在 OpenClaw 交互式设置时可将 API 密钥留空。

认证配置细节见 LM Studio 认证文档

  1. 运行引导配置并选择 LM Studio
bash
openclaw onboard
  1. 在引导过程中,使用 Default model 提示选择你的 LM Studio 模型。

也可以事后修改:

bash
openclaw models set lmstudio/qwen/qwen3.5-9b

LM Studio 模型键的格式为 author/model-name(如 qwen/qwen3.5-9b)。OpenClaw 的模型引用在前面加上 provider 名:lmstudio/qwen/qwen3.5-9b。要获取精确的模型键,运行:

bash
curl http://localhost:1234/api/v1/models

查看响应中的 key 字段。

非交互式引导配置

当需要脚本化设置(CI、预配置、远程引导)时,使用非交互式模式:

bash
openclaw onboard \
  --non-interactive \
  --accept-risk \
  --auth-choice lmstudio

或者指定 base URL、模型和可选 API key:

bash
openclaw onboard \
  --non-interactive \
  --accept-risk \
  --auth-choice lmstudio \
  --custom-base-url http://localhost:1234/v1 \
  --lmstudio-api-key "$LM_API_TOKEN" \
  --custom-model-id qwen/qwen3.5-9b

--custom-model-id 接受 LM Studio 返回的模型键(如 qwen/qwen3.5-9b),不带 lmstudio/ 前缀。

对于启用认证的 LM Studio 服务器,需传递 --lmstudio-api-key 或设置 LM_API_TOKEN;对于未认证的服务器,可省略 key,OpenClaw 将存储一个本地非敏感标记。

--custom-api-key 仍兼容,但 LM Studio 建议优先使用 --lmstudio-api-key

上述命令会写入 models.providers.lmstudio 并将默认模型设为 lmstudio/<custom-model-id>。如果提供了 API key,还会写入 lmstudio:default 认证配置。

交互式设置可提示可选的首选加载上下文长度,并将其应用到发现的 LM Studio 模型中。LM Studio 插件配置信任已配置的端点用于模型请求,包括 loopback、LAN 和 tailnet 主机。元数据/链接本地来源仍需显式选择加入。可通过设置 models.providers.lmstudio.request.allowPrivateNetwork: false 来退出信任。

配置

流式使用兼容性

LM Studio 支持流式 token 用量统计。当 LM Studio 未输出 OpenAI 格式的 usage 对象时,OpenClaw 会从 llama.cpp 风格的 timings.prompt_n / timings.predicted_n 元数据中恢复 token 计数。

同样的流式用量行为适用于以下 OpenAI 兼容本地后端:

  • vLLM
  • SGLang
  • llama.cpp
  • LocalAI
  • Jan
  • TabbyAPI
  • text-generation-webui

推理选项兼容性

当 LM Studio 的 /api/v1/models 发现接口返回模型特定的推理选项时,OpenClaw 会在模型兼容元数据中暴露匹配的 OpenAI 兼容 reasoning_effort 值。当前 LM Studio 版本可能将 UI 选项发布为 allowed_options: ["off", "on"],但在 /v1/chat/completions 上会拒绝这些值;OpenClaw 会将二进制发现形状标准化为 noneminimallowmediumhighxhigh 后再发送请求。旧版保存的配置中包含 off/on 推理映射的,加载目录时也会做同样标准化。

显式配置

json5
{
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://localhost:1234/v1",
        apiKey: "${LM_API_TOKEN}",
        api: "openai-completions",
        models: [
          {
            id: "qwen/qwen3-coder-next",
            name: "Qwen 3 Coder Next",
            reasoning: false,
            input: ["text"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 128000,
            maxTokens: 8192,
          },
        ],
      },
    },
  },
}

故障排查

LM Studio 未检测到

确保 LM Studio 正在运行。如果启用了认证,同时设置 LM_API_TOKEN

bash
# 启动桌面应用,或无头模式:
lms server start --port 1234

验证 API 可访问:

bash
curl http://localhost:1234/api/v1/models

认证错误 (HTTP 401)

如果设置时报告 HTTP 401,请检查 API key:

  • 确认 LM_API_TOKEN 与 LM Studio 中配置的 key 一致。
  • 详细认证设置见 LM Studio 认证文档
  • 如果服务器不需要认证,设置时将 key 留空。

Just-in-time 模型加载

LM Studio 支持 JIT 模型加载(模型在首次请求时加载)。默认情况下,OpenClaw 会通过 LM Studio 的原生加载端点预加载模型,这有助于在 JIT 禁用时保持响应。如果要让 LM Studio 的 JIT、空闲 TTL 和自动驱逐机制控制模型生命周期,可禁用 OpenClaw 的预加载步骤:

json5
{
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://localhost:1234/v1",
        api: "openai-completions",
        params: { preload: false },
        models: [{ id: "qwen/qwen3.5-9b" }],
      },
    },
  },
}

LAN 或 tailnet 上的 LM Studio 主机

使用 LM Studio 主机的可访问地址,保留 /v1,并确保 LM Studio 绑定了非 loopback 地址:

json5
{
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://gpu-box.local:1234/v1",
        apiKey: "lmstudio",
        api: "openai-completions",
        models: [{ id: "qwen/qwen3.5-9b" }],
      },
    },
  },
}

LM Studio 插件自动信任其配置的本地/私有端点用于受保护的模型请求。自定义的本地 OpenAI 兼容提供者也信任其精确配置的 baseUrl 来源,但元数据/链接本地来源除外;请求到不同私有端口或目标仍需设置 models.providers.<id>.request.allowPrivateNetwork: true。设置 models.providers.<id>.request.allowPrivateNetwork: false 可退出精确来源信任。

相关

常见问题

LM Studio 连接不上怎么办?

确认 LM Studio 服务器已启动并在监听端口 1234,运行 curl http://localhost:1234/api/v1/models 测试。如果启用了认证,检查环境变量 LM_API_TOKEN 是否设置正确。若使用无头模式,确保已执行 lms server start --port 1234

设置认证后提示 401 错误怎么解决?

401 错误说明 API key 不匹配。请核对 LM_API_TOKEN 与 LM Studio 中设置的 key 一致(可在 LM Studio 设置中查看或重置)。如果服务器不需要认证,在 OpenClaw 设置中将 API key 留空即可。

怎么让 OpenClaw 不预加载模型,交给 LM Studio JIT 管理?

在配置中将 models.providers.lmstudio 下的 params.preload 设为 false。这样 OpenClaw 不会主动调用 LM Studio 的加载端点,模型生命周期完全由 LM Studio 的 JIT、空闲 TTL 和自动驱逐机制管理。