Skip to content

NVIDIA NIM 是 Free Claude Code 的默认推荐后端,提供免费 GPU 推理额度,支持 GLM、Kimi、MiniMax 等模型。只需在 build.nvidia.com 申请 API Key,配置到 .env 即可。

Free Claude Code 接入 NVIDIA NIM:免费 GPU 推力驱动 Claude Code

为什么选 NVIDIA NIM

NVIDIA NIM 是 NVIDIA 提供的模型推理服务,基于 NVIDIA GPU 集群。它有两个核心优势:

  1. 免费额度:注册即送 API 调用额度,日常开发够用
  2. 模型丰富:支持多家国产和海外模型,且持续更新

NVIDIA NIM 的传输层使用 OpenAI Chat Completions 格式。Free Claude Code 在内部将 Anthropic Messages 请求翻译成 OpenAI Chat 格式发给 NIM,再把 NIM 的流式响应转回 Anthropic SSE 格式。这个过程对 Claude Code 完全透明。

申请 API Key

  1. 访问 build.nvidia.com/settings/api-keys
  2. 登录或注册 NVIDIA 账号
  3. 创建 API Key,复制保存

提示:API Key 以 nvapi- 开头,格式为 nvapi-xxxxxxxx...

配置 .env

dotenv
NVIDIA_NIM_API_KEY="nvapi-你的密钥"
MODEL="nvidia_nim/z-ai/glm4.7"
ANTHROPIC_AUTH_TOKEN="freecc"

MODEL 的格式是 nvidia_nim/模型发布者/模型名。这个格式决定了代理把请求路由到哪个 Provider(nvidia_nim)以及具体用哪个模型。

可用模型

build.nvidia.com/explore/discover 浏览全部模型。以下是经过社区验证、适合 Claude Code 工作流的推荐:

模型说明
nvidia_nim/z-ai/glm4.7智谱 GLM-4.7,默认推荐
nvidia_nim/z-ai/glm5智谱 GLM-5,更强
nvidia_nim/moonshotai/kimi-k2.5Moonshot Kimi K2.5,推理能力强
nvidia_nim/minimaxai/minimax-m2.5MiniMax M2.5

切换模型只需修改 .env 中的 MODEL 值并重启代理。

验证连通性

启动代理后,确认模型可用:

bash
# 检查代理配置
curl http://localhost:8082/
# 返回 {"status":"ok","provider":"nvidia_nim","model":"z-ai/glm4.7"}

# 启动 Claude Code
ANTHROPIC_AUTH_TOKEN="freecc" ANTHROPIC_BASE_URL="http://localhost:8082" claude

正常对话几句,确认模型能响应、工具调用正常即可。

网络代理

如果你的网络环境需要通过代理访问 NVIDIA API:

dotenv
NVIDIA_NIM_PROXY="http://username:password@host:port"

支持 HTTP 和 SOCKS5 代理。

速率限制

默认配置:

dotenv
PROVIDER_RATE_LIMIT=1       # 每窗口最大请求数
PROVIDER_RATE_WINDOW=3      # 窗口大小(秒)
PROVIDER_MAX_CONCURRENCY=5  # 最大并发请求数

免费额度下这些值通常够用。如果你频繁遇到 429 错误,可以适当增大 PROVIDER_RATE_WINDOW

FAQ

Q: NVIDIA NIM 免费额度用完了怎么办? A: 切换到 OpenRouter本地模型。NIM 的免费额度按模型独立计算,换个模型可能还有额度。

Q: 为什么选 GLM 而不是其他模型? A: GLM-4.7 在 NIM 上是社区反馈最好的免费模型之一,工具调用(tool use)兼容性好,响应速度快。Kimi K2.5 推理能力更强但可能消耗更多 Token。

Q: NVIDIA NIM 的 OpenAI 兼容层和直接用 OpenAI API 有什么区别? A: NIM 用的是 OpenAI Chat Completions 格式(/v1/chat/completions),但背后的模型是 NVIDIA 集群上托管的第三方模型,不是 OpenAI 的模型。Free Claude Code 已经处理好了协议转换,你不需要关心底层格式。