Skip to content

GitHub Copilot 设有两种速率限制:会话限制(重置前需等待)和每周 Token 限额(7 天周期)。高端模型消耗更多 Premium 请求额度,自动模式可以在接近限额时自动降级模型,避免完全中断服务。本页解释各限制的触发条件和应对策略。

GitHub Copilot 使用限制详解:速率限制、Weekly 限额与升级建议

为什么有使用限制

GitHub Copilot 设置速率限制的原因有三:

  1. 容量管理:防止少数用户占用过多资源影响其他用户
  2. 公平使用:确保服务对所有用户的响应质量
  3. 防止滥用:避免自动化脚本等异常使用模式

两种限制类型

会话限制(Session Limit)

在单个对话 session 中有最大请求次数限制。触发后:

  • 服务暂停,需要等待会话限制重置
  • 等待期间无法继续使用 Copilot

VS Code 和 Copilot CLI 会在接近限制时显示警告提示

每周 Token 限额(Weekly Limit)

跨越 7 天周期的总 Token 消耗上限。不同套餐的限额差异较大:

套餐相对限额
Copilot Free最低
Copilot Pro较高
Copilot Pro+显著更高
Copilot Business按管理员配置
Copilot Enterprise按管理员配置

具体数字以 GitHub 官方文档为准,限额会随时更新。

哪些操作消耗更多额度

高端模型消耗的 Premium 请求数量显著高于标准模型:

  • 标准操作(内联建议、Ask 模式基础问答):消耗量低
  • 高端模型 Chat(o1、Claude Opus、Gemini Ultra):消耗量高
  • Agent 模式:每次自主操作循环消耗多次请求,累计消耗量大
  • 代码审查:按 PR 差异大小消耗不等的 Token

减少用量消耗的技巧

1. 简单任务用低倍率模型

不是每个问题都需要最强的模型。常规代码解释、简单 bug 修复用标准模型(GPT-4o mini 等)就够了,把高端模型的额度留给真正复杂的任务。

2. 使用 Plan 模式减少无效循环

Plan 模式会先生成详细方案供你审核,不会执行任何代码修改直到你确认。相比 Agent 模式盲目运行然后出错反复重试,Plan 模式通常能在更少的 Token 消耗下完成同样的任务。

3. 避免并行开启多个 Agent 工作流

多个 Agent 会话并行运行会快速叠加消耗。如果你同时开了多个 Chat 窗口跑 Agent,考虑串行完成。

4. 启用自动模型选择(Auto)

在 Chat 的模型选择器中选择 Auto,Copilot 会在接近高端模型额度上限时自动降级到标准模型,而不是直接停服。

触发限制后怎么办

情况建议操作
会话限制触发等待会话重置(通常几分钟到几小时)
周 Premium 请求耗尽切换到 Auto 模式,可用标准模型继续
经常触发限制升级到 Pro+ 或检查是否有异常的高用量操作
影响正常工作联系 GitHub Support

常见问题

Q: 限制重置的周期是怎么算的?

A: 每周限额以滚动 7 天为周期(不是固定的周一到周日),即从你开始使用起的 7 天后第一批额度会自动恢复。

Q: Copilot Free 用户触发限制后有什么选择?

A: 触发限制后可以等待重置,或者升级到 Pro 版获得更高额度。如果只是需要标准功能,切换到使用量更少的模型(或暂时停用 Agent 模式)也能延长可用时间。

Q: 内联代码建议(inline suggestions)也受这些限制吗?

A: 内联建议使用独立的用量系统,通常限制比 Chat 宽松得多,日常编码场景很少会触发内联建议的速率限制。高用量主要来自 Chat(尤其是 Agent 模式)。