Appearance
NVIDIA NIM 是 Free Claude Code 的默认推荐后端,提供免费 GPU 推理额度,支持 GLM、Kimi、MiniMax 等模型。只需在 build.nvidia.com 申请 API Key,配置到 .env 即可。
Free Claude Code 接入 NVIDIA NIM:免费 GPU 推力驱动 Claude Code
为什么选 NVIDIA NIM
NVIDIA NIM 是 NVIDIA 提供的模型推理服务,基于 NVIDIA GPU 集群。它有两个核心优势:
- 免费额度:注册即送 API 调用额度,日常开发够用
- 模型丰富:支持多家国产和海外模型,且持续更新
NVIDIA NIM 的传输层使用 OpenAI Chat Completions 格式。Free Claude Code 在内部将 Anthropic Messages 请求翻译成 OpenAI Chat 格式发给 NIM,再把 NIM 的流式响应转回 Anthropic SSE 格式。这个过程对 Claude Code 完全透明。
申请 API Key
- 访问 build.nvidia.com/settings/api-keys
- 登录或注册 NVIDIA 账号
- 创建 API Key,复制保存
提示:API Key 以
nvapi-开头,格式为nvapi-xxxxxxxx...。
配置 .env
dotenv
NVIDIA_NIM_API_KEY="nvapi-你的密钥"
MODEL="nvidia_nim/z-ai/glm4.7"
ANTHROPIC_AUTH_TOKEN="freecc"MODEL 的格式是 nvidia_nim/模型发布者/模型名。这个格式决定了代理把请求路由到哪个 Provider(nvidia_nim)以及具体用哪个模型。
可用模型
在 build.nvidia.com/explore/discover 浏览全部模型。以下是经过社区验证、适合 Claude Code 工作流的推荐:
| 模型 | 说明 |
|---|---|
nvidia_nim/z-ai/glm4.7 | 智谱 GLM-4.7,默认推荐 |
nvidia_nim/z-ai/glm5 | 智谱 GLM-5,更强 |
nvidia_nim/moonshotai/kimi-k2.5 | Moonshot Kimi K2.5,推理能力强 |
nvidia_nim/minimaxai/minimax-m2.5 | MiniMax M2.5 |
切换模型只需修改 .env 中的 MODEL 值并重启代理。
验证连通性
启动代理后,确认模型可用:
bash
# 检查代理配置
curl http://localhost:8082/
# 返回 {"status":"ok","provider":"nvidia_nim","model":"z-ai/glm4.7"}
# 启动 Claude Code
ANTHROPIC_AUTH_TOKEN="freecc" ANTHROPIC_BASE_URL="http://localhost:8082" claude正常对话几句,确认模型能响应、工具调用正常即可。
网络代理
如果你的网络环境需要通过代理访问 NVIDIA API:
dotenv
NVIDIA_NIM_PROXY="http://username:password@host:port"支持 HTTP 和 SOCKS5 代理。
速率限制
默认配置:
dotenv
PROVIDER_RATE_LIMIT=1 # 每窗口最大请求数
PROVIDER_RATE_WINDOW=3 # 窗口大小(秒)
PROVIDER_MAX_CONCURRENCY=5 # 最大并发请求数免费额度下这些值通常够用。如果你频繁遇到 429 错误,可以适当增大 PROVIDER_RATE_WINDOW。
FAQ
Q: NVIDIA NIM 免费额度用完了怎么办? A: 切换到 OpenRouter 或 本地模型。NIM 的免费额度按模型独立计算,换个模型可能还有额度。
Q: 为什么选 GLM 而不是其他模型? A: GLM-4.7 在 NIM 上是社区反馈最好的免费模型之一,工具调用(tool use)兼容性好,响应速度快。Kimi K2.5 推理能力更强但可能消耗更多 Token。
Q: NVIDIA NIM 的 OpenAI 兼容层和直接用 OpenAI API 有什么区别? A: NIM 用的是 OpenAI Chat Completions 格式(/v1/chat/completions),但背后的模型是 NVIDIA 集群上托管的第三方模型,不是 OpenAI 的模型。Free Claude Code 已经处理好了协议转换,你不需要关心底层格式。