Appearance
API Key 使用时频繁出现 503 模型过载错误(The model is overloaded)
问题
使用 Gemini API Key 时(免费或付费),向 gemini-2.5-pro 或 gemini-2.5-flash 发送请求时频繁出现:
[API Error: got status: UNAVAILABLE. {"error":{"code":503,"message":"The model is overloaded. Please try again later.","status":"UNAVAILABLE"}}]即使是付费 API Key 也无法正常使用,错误会持续多小时甚至数天。部分用户反映 2.5 Pro 过载时切换到 2.5 Flash 也同样报错。
解决方案
方案 1:切换到 Flash 模型(最快见效)
通过 /model 切换到 Flash 模型(比 Pro 容量更大):
/model在菜单中选择 Flash 或 Auto。Auto 路由会自动选择当前可用且最合适的模型,当 Pro 过载时会路由到 Flash。
方案 2:使用 Google 账号认证代替 API Key
免费 API Key 和 Google 账号(Code Assist 个人版)共享不同的配额池。如果 API Key 报错,尝试切换到 Google 账号认证:
bash
gemini auth login方案 3:等待 Google 扩容
503 错误通常是服务端容量不足导致的,不是你的使用方式有问题。建议:
- 在 Google AI Studio 测试相同 API Key,若 Studio 正常而 CLI 报错,说明是 CLI 端的配额路由问题
- 关注 Google Status 查看服务状态
- 在 GitHub Issues 搜索同类问题,确认是否为已知服务事故
方案 4:减少并发请求
如果你在脚本或无头模式中大量并发调用,考虑添加请求间隔避免集中打到同一模型实例。