Skip to content

GitHub Copilot 把用户操作分为普通请求和 Premium 请求两类。Premium 请求用于高端模型和 Agent 模式等高消耗功能,不同模型有不同的倍率系数。理解这个计费逻辑有助于减少不必要的额度消耗。

GitHub Copilot 请求类型详解:什么是 Premium 请求,怎么算消耗

请求的定义

在 Copilot 的语境里,一次请求是指你向 Copilot 发起的任何一次交互,包括:

  • 在 Chat 里发一条消息
  • 在 CLI 里提一个问题
  • 通过扩展(Extension)发起的调用

两种请求类型

普通请求(Included Requests)

使用套餐内包含的标准模型处理的请求,不额外计入 Premium 配额。大部分日常场景使用标准模型即可满足需求。

Premium 请求

使用高端模型高消耗功能时才计入 Premium 请求。消耗量因功能和模型不同而异:

功能 / 模型Premium 请求倍率
标准模型 Chat(GPT-4o mini 等)0(不消耗 Premium)
GPT-4o / Claude Sonnet1x
o1-preview / Claude Opus较高(具体倍率见官方文档)
Agent 模式(每次循环)可能消耗多次
代码审查(Code Review)按 PR 差异大小变化

重要:内联代码建议(inline suggestions)有独立配额,不消耗 Premium 请求,日常编码场景极少触发限制。

Free 版本的额度限制

Copilot Free 每月包含:

  • 2,000 次内联建议
  • 50 次 Premium 请求

50 次 Premium 请求用完后,Chat 仍可用标准模型继续对话,但高端模型功能会受限。

如何减少 Premium 请求消耗

  1. 使用 Auto 模式:Copilot 会自动选择最高效的模型,付费套餐还有 10% 折扣
  2. 明确任务时直接选小模型:简单代码解释/问答不需要 Opus 级别的模型
  3. 避免不必要的 Agent 模式循环:复杂任务先用 Plan 模式预览方案
  4. 关注内联建议 vs Chat 的区别:内联建议配额宽松得多

查看当前用量

在 GitHub 账号设置 → CopilotUsage 可以查看:

  • 当月 Premium 请求已用 / 总配额
  • 按日的请求量趋势
  • 各功能的消耗分布

2026 年 6 月计费模式变化

GitHub 计划从 2026 年 6 月 1 日起切换为基于用量(token)计费,不再按请求次数计算。切换后的计费模式会更精细,高端模型的长对话会产生更高成本,短问答则更便宜。

常见问题

Q: 一次 Agent 模式执行消耗多少 Premium 请求?

A: 取决于 Agent 需要执行多少步操作。每一次工具调用(读文件、运行命令)都可能消耗 1 次,Agent 执行复杂任务时(十几步循环)可能消耗十几次 Premium 请求。建议先用 Plan 模式确认方案再执行。

Q: 每月的 Premium 配额是几号重置的?

A: 每月 1 日自动重置,未用完的不累计到下月。

Q: 用 Claude Sonnet 和 GPT-4o 消耗是一样的吗?

A: 两者倍率相似(通常都是 1x),但具体倍率以 GitHub 官方文档为准,不同版本的 Claude(Sonnet 4.5 vs 4.6)倍率可能不同。