Appearance
GitHub Copilot 设有两种速率限制:会话限制(重置前需等待)和每周 Token 限额(7 天周期)。高端模型消耗更多 Premium 请求额度,自动模式可以在接近限额时自动降级模型,避免完全中断服务。本页解释各限制的触发条件和应对策略。
GitHub Copilot 使用限制详解:速率限制、Weekly 限额与升级建议
为什么有使用限制
GitHub Copilot 设置速率限制的原因有三:
- 容量管理:防止少数用户占用过多资源影响其他用户
- 公平使用:确保服务对所有用户的响应质量
- 防止滥用:避免自动化脚本等异常使用模式
两种限制类型
会话限制(Session Limit)
在单个对话 session 中有最大请求次数限制。触发后:
- 服务暂停,需要等待会话限制重置
- 等待期间无法继续使用 Copilot
VS Code 和 Copilot CLI 会在接近限制时显示警告提示。
每周 Token 限额(Weekly Limit)
跨越 7 天周期的总 Token 消耗上限。不同套餐的限额差异较大:
| 套餐 | 相对限额 |
|---|---|
| Copilot Free | 最低 |
| Copilot Pro | 较高 |
| Copilot Pro+ | 显著更高 |
| Copilot Business | 按管理员配置 |
| Copilot Enterprise | 按管理员配置 |
具体数字以 GitHub 官方文档为准,限额会随时更新。
哪些操作消耗更多额度
高端模型消耗的 Premium 请求数量显著高于标准模型:
- 标准操作(内联建议、Ask 模式基础问答):消耗量低
- 高端模型 Chat(o1、Claude Opus、Gemini Ultra):消耗量高
- Agent 模式:每次自主操作循环消耗多次请求,累计消耗量大
- 代码审查:按 PR 差异大小消耗不等的 Token
减少用量消耗的技巧
1. 简单任务用低倍率模型
不是每个问题都需要最强的模型。常规代码解释、简单 bug 修复用标准模型(GPT-4o mini 等)就够了,把高端模型的额度留给真正复杂的任务。
2. 使用 Plan 模式减少无效循环
Plan 模式会先生成详细方案供你审核,不会执行任何代码修改直到你确认。相比 Agent 模式盲目运行然后出错反复重试,Plan 模式通常能在更少的 Token 消耗下完成同样的任务。
3. 避免并行开启多个 Agent 工作流
多个 Agent 会话并行运行会快速叠加消耗。如果你同时开了多个 Chat 窗口跑 Agent,考虑串行完成。
4. 启用自动模型选择(Auto)
在 Chat 的模型选择器中选择 Auto,Copilot 会在接近高端模型额度上限时自动降级到标准模型,而不是直接停服。
触发限制后怎么办
| 情况 | 建议操作 |
|---|---|
| 会话限制触发 | 等待会话重置(通常几分钟到几小时) |
| 周 Premium 请求耗尽 | 切换到 Auto 模式,可用标准模型继续 |
| 经常触发限制 | 升级到 Pro+ 或检查是否有异常的高用量操作 |
| 影响正常工作 | 联系 GitHub Support |
常见问题
Q: 限制重置的周期是怎么算的?
A: 每周限额以滚动 7 天为周期(不是固定的周一到周日),即从你开始使用起的 7 天后第一批额度会自动恢复。
Q: Copilot Free 用户触发限制后有什么选择?
A: 触发限制后可以等待重置,或者升级到 Pro 版获得更高额度。如果只是需要标准功能,切换到使用量更少的模型(或暂时停用 Agent 模式)也能延长可用时间。
Q: 内联代码建议(inline suggestions)也受这些限制吗?
A: 内联建议使用独立的用量系统,通常限制比 Chat 宽松得多,日常编码场景很少会触发内联建议的速率限制。高用量主要来自 Chat(尤其是 Agent 模式)。