GitHub Copilot 设有两种速率限制：会话限制（重置前需等待）和每周 Token 限额（7 天周期）。高端模型消耗更多 Premium 请求额度，自动模式可以在接近限额时自动降级模型，避免完全中断服务。本页解释各限制的触发条件和应对策略。

GitHub Copilot 使用限制详解：速率限制、Weekly 限额与升级建议

为什么有使用限制

GitHub Copilot 设置速率限制的原因有三：

容量管理：防止少数用户占用过多资源影响其他用户
公平使用：确保服务对所有用户的响应质量
防止滥用：避免自动化脚本等异常使用模式

两种限制类型

会话限制（Session Limit）

在单个对话 session 中有最大请求次数限制。触发后：

服务暂停，需要等待会话限制重置
等待期间无法继续使用 Copilot

VS Code 和 Copilot CLI 会在接近限制时显示警告提示。

每周 Token 限额（Weekly Limit）

跨越 7 天周期的总 Token 消耗上限。不同套餐的限额差异较大：

套餐	相对限额
Copilot Free	最低
Copilot Pro	较高
Copilot Pro+	显著更高
Copilot Business	按管理员配置
Copilot Enterprise	按管理员配置

具体数字以 GitHub 官方文档为准，限额会随时更新。

哪些操作消耗更多额度

高端模型消耗的 Premium 请求数量显著高于标准模型：

标准操作（内联建议、Ask 模式基础问答）：消耗量低
高端模型 Chat（o1、Claude Opus、Gemini Ultra）：消耗量高
Agent 模式：每次自主操作循环消耗多次请求，累计消耗量大
代码审查：按 PR 差异大小消耗不等的 Token

减少用量消耗的技巧

1. 简单任务用低倍率模型

不是每个问题都需要最强的模型。常规代码解释、简单 bug 修复用标准模型（GPT-4o mini 等）就够了，把高端模型的额度留给真正复杂的任务。

2. 使用 Plan 模式减少无效循环

Plan 模式会先生成详细方案供你审核，不会执行任何代码修改直到你确认。相比 Agent 模式盲目运行然后出错反复重试，Plan 模式通常能在更少的 Token 消耗下完成同样的任务。

3. 避免并行开启多个 Agent 工作流

多个 Agent 会话并行运行会快速叠加消耗。如果你同时开了多个 Chat 窗口跑 Agent，考虑串行完成。

4. 启用自动模型选择（Auto）

在 Chat 的模型选择器中选择 Auto，Copilot 会在接近高端模型额度上限时自动降级到标准模型，而不是直接停服。

触发限制后怎么办

情况	建议操作
会话限制触发	等待会话重置（通常几分钟到几小时）
周 Premium 请求耗尽	切换到 Auto 模式，可用标准模型继续
经常触发限制	升级到 Pro+ 或检查是否有异常的高用量操作
影响正常工作	联系 GitHub Support

常见问题

Q: 限制重置的周期是怎么算的？

A: 每周限额以滚动 7 天为周期（不是固定的周一到周日），即从你开始使用起的 7 天后第一批额度会自动恢复。

Q: Copilot Free 用户触发限制后有什么选择？

A: 触发限制后可以等待重置，或者升级到 Pro 版获得更高额度。如果只是需要标准功能，切换到使用量更少的模型（或暂时停用 Agent 模式）也能延长可用时间。

Q: 内联代码建议（inline suggestions）也受这些限制吗？

A: 内联建议使用独立的用量系统，通常限制比 Chat 宽松得多，日常编码场景很少会触发内联建议的速率限制。高用量主要来自 Chat（尤其是 Agent 模式）。

GitHub Copilot 使用限制详解：速率限制、Weekly 限额与升级建议 #

为什么有使用限制 #

两种限制类型 #

会话限制（Session Limit） #

每周 Token 限额（Weekly Limit） #

哪些操作消耗更多额度 #

减少用量消耗的技巧 #

1. 简单任务用低倍率模型 #

2. 使用 Plan 模式减少无效循环 #

3. 避免并行开启多个 Agent 工作流 #

4. 启用自动模型选择（Auto） #

触发限制后怎么办 #

常见问题 #