Appearance
GitHub Copilot 把用户操作分为普通请求和 Premium 请求两类。Premium 请求用于高端模型和 Agent 模式等高消耗功能,不同模型有不同的倍率系数。理解这个计费逻辑有助于减少不必要的额度消耗。
GitHub Copilot 请求类型详解:什么是 Premium 请求,怎么算消耗
请求的定义
在 Copilot 的语境里,一次请求是指你向 Copilot 发起的任何一次交互,包括:
- 在 Chat 里发一条消息
- 在 CLI 里提一个问题
- 通过扩展(Extension)发起的调用
两种请求类型
普通请求(Included Requests)
使用套餐内包含的标准模型处理的请求,不额外计入 Premium 配额。大部分日常场景使用标准模型即可满足需求。
Premium 请求
使用高端模型或高消耗功能时才计入 Premium 请求。消耗量因功能和模型不同而异:
| 功能 / 模型 | Premium 请求倍率 |
|---|---|
| 标准模型 Chat(GPT-4o mini 等) | 0(不消耗 Premium) |
| GPT-4o / Claude Sonnet | 1x |
| o1-preview / Claude Opus | 较高(具体倍率见官方文档) |
| Agent 模式(每次循环) | 可能消耗多次 |
| 代码审查(Code Review) | 按 PR 差异大小变化 |
重要:内联代码建议(inline suggestions)有独立配额,不消耗 Premium 请求,日常编码场景极少触发限制。
Free 版本的额度限制
Copilot Free 每月包含:
- 2,000 次内联建议
- 50 次 Premium 请求
50 次 Premium 请求用完后,Chat 仍可用标准模型继续对话,但高端模型功能会受限。
如何减少 Premium 请求消耗
- 使用 Auto 模式:Copilot 会自动选择最高效的模型,付费套餐还有 10% 折扣
- 明确任务时直接选小模型:简单代码解释/问答不需要 Opus 级别的模型
- 避免不必要的 Agent 模式循环:复杂任务先用 Plan 模式预览方案
- 关注内联建议 vs Chat 的区别:内联建议配额宽松得多
查看当前用量
在 GitHub 账号设置 → Copilot → Usage 可以查看:
- 当月 Premium 请求已用 / 总配额
- 按日的请求量趋势
- 各功能的消耗分布
2026 年 6 月计费模式变化
GitHub 计划从 2026 年 6 月 1 日起切换为基于用量(token)计费,不再按请求次数计算。切换后的计费模式会更精细,高端模型的长对话会产生更高成本,短问答则更便宜。
常见问题
Q: 一次 Agent 模式执行消耗多少 Premium 请求?
A: 取决于 Agent 需要执行多少步操作。每一次工具调用(读文件、运行命令)都可能消耗 1 次,Agent 执行复杂任务时(十几步循环)可能消耗十几次 Premium 请求。建议先用 Plan 模式确认方案再执行。
Q: 每月的 Premium 配额是几号重置的?
A: 每月 1 日自动重置,未用完的不累计到下月。
Q: 用 Claude Sonnet 和 GPT-4o 消耗是一样的吗?
A: 两者倍率相似(通常都是 1x),但具体倍率以 GitHub 官方文档为准,不同版本的 Claude(Sonnet 4.5 vs 4.6)倍率可能不同。