Skip to content

API Key 使用时频繁出现 503 模型过载错误(The model is overloaded)

问题

使用 Gemini API Key 时(免费或付费),向 gemini-2.5-pro 或 gemini-2.5-flash 发送请求时频繁出现:

[API Error: got status: UNAVAILABLE. {"error":{"code":503,"message":"The model is overloaded. Please try again later.","status":"UNAVAILABLE"}}]

即使是付费 API Key 也无法正常使用,错误会持续多小时甚至数天。部分用户反映 2.5 Pro 过载时切换到 2.5 Flash 也同样报错。

解决方案

方案 1:切换到 Flash 模型(最快见效)

通过 /model 切换到 Flash 模型(比 Pro 容量更大):

/model

在菜单中选择 FlashAuto。Auto 路由会自动选择当前可用且最合适的模型,当 Pro 过载时会路由到 Flash。

方案 2:使用 Google 账号认证代替 API Key

免费 API Key 和 Google 账号(Code Assist 个人版)共享不同的配额池。如果 API Key 报错,尝试切换到 Google 账号认证:

bash
gemini auth login

方案 3:等待 Google 扩容

503 错误通常是服务端容量不足导致的,不是你的使用方式有问题。建议:

  • Google AI Studio 测试相同 API Key,若 Studio 正常而 CLI 报错,说明是 CLI 端的配额路由问题
  • 关注 Google Status 查看服务状态
  • GitHub Issues 搜索同类问题,确认是否为已知服务事故

方案 4:减少并发请求

如果你在脚本或无头模式中大量并发调用,考虑添加请求间隔避免集中打到同一模型实例。