Appearance
费用管理:控制 Claude Code 的 Token 用量
Claude Code 按 API token 消耗计费。企业部署的平均费用约为每位开发者每个活跃工作日 $13,月均 $150-250,90% 的用户日均低于 $30。订阅计划(Pro、Max、Team、Enterprise)参见 claude.com/pricing。追踪用量用 /cost 命令,团队用 Claude Console 工作区设置消费限额。降低成本的核心策略:保持 CLAUDE.md 在 200 行以内、选合适模型(Haiku 处理简单子代理任务)、把大量输出委托给子代理、用 Hooks 预处理数据、写具体的提示词。
Claude Code 按 API token 消耗计费。订阅计划(Pro、Max、Team、Enterprise)价格参见 claude.com/pricing。
企业部署参考数据:
- 平均:约 $13/开发者/活跃工作日
- 月均:$150-250/开发者
- 90% 的用户日均低于 $30
实际成本因模型选择、代码库大小、并发实例数量和自动化程度差异较大。建议先从小团队 pilot 开始,用下方工具建立基准数据,再做更大范围推广。
追踪费用
/cost 命令
text
/cost输出当前会话的 token 用量统计:
Total cost: $0.55
Total duration (API): 6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes: 0 lines added, 0 lines removed
/cost面向 API 用户。Claude Max/Pro 订阅用户费用包含在订阅内,可用/stats查看用量趋势。
Status Line 实时监控
配置 Status Line 在底部状态栏显示上下文使用百分比,随时了解当前状态。
团队费用管理
API 用户
在 Claude Console 设置工作区消费限额,管理员可查看成本和用量报告。
首次用 Claude Console 账号认证时,会自动创建名为"Claude Code"的工作区,集中追踪组织内所有 Claude Code 用量。
第三方云用户(Bedrock/Vertex/Foundry)
Claude Code 不向你的云端发送指标。大企业常用 LiteLLM 按 key 追踪消费(开源工具,Anthropic 未认证)。
团队速率限制建议
| 团队规模 | 建议 TPM/人 | 建议 RPM/人 |
|---|---|---|
| 1-5 人 | 200k-300k | 5-7 |
| 5-20 人 | 100k-150k | 2.5-3.5 |
| 20-50 人 | 50k-75k | 1.25-1.75 |
| 50-100 人 | 25k-35k | 0.62-0.87 |
| 100-500 人 | 15k-20k | 0.37-0.47 |
| 500+ 人 | 10k-15k | 0.25-0.35 |
速率限制在组织级别生效,不是每人独立的。人少时个人可以用更多,人多时并发比例较低所以每人分配少一些。
如果有大规模并发的场景(如团队培训),可能需要更高配额。
Agent Teams 的 token 开销
Agent Teams 会生成多个 Claude Code 实例,每个都有自己的上下文窗口。Token 用量随活跃成员数量和运行时长扩大。控制 Agent Teams 成本的建议:
- 成员用 Sonnet:均衡能力和成本
- 控制团队规模:每个成员都有独立上下文,token 用量大致与团队规模成正比
- 精简启动提示:成员自动加载 CLAUDE.md、MCP 服务器和技能,启动提示里的内容从一开始就占用上下文
- 任务完成后及时清理:活跃成员即使空闲也会持续消耗 token
- Agent Teams 默认禁用,通过设置
CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1开启,详见 Agent Teams
减少 Token 用量的实用策略
Token 费用随上下文大小扩展,上下文越大,每次消息用的 token 越多。
1. 主动管理上下文
及时清理:做完一个不相关的任务后用 /clear 重置会话。保留无用上下文会在后续每条消息中浪费 token。
提示:用 /rename 给当前会话命名,清理后可以用 /resume 找回。
自定义压缩指令:
text
/compact Focus on code samples and API usage在 CLAUDE.md 里全局配置压缩行为:
markdown
# Compact instructions
When you are using compact, please focus on test output and code changes2. 选择合适的模型
Sonnet 能处理大多数编程任务,且比 Opus 便宜很多。架构设计或复杂推理才需要 Opus。
- 用
/model切换模型 - 在
/config设置默认模型 - 子代理简单任务可指定
model: haiku
3. 减少 MCP 服务器开销
每个 MCP 服务器会向上下文添加工具定义,即使闲置也消耗 token。
用 /context 查看占用情况:
- 优先用 CLI 工具:
gh、aws、gcloud、sentry-cli这类命令行工具比 MCP 服务器更省上下文 - 禁用不用的服务器:用
/mcp查看并关闭 - 工具搜索自动触发:当 MCP 工具描述超过上下文的 10% 时,Claude Code 自动延迟加载。降低触发阈值:
ENABLE_TOOL_SEARCH=auto:5(5% 时触发)
4. 安装代码智能插件
代码智能插件 让 Claude 用符号导航(跳转定义、查找引用)替代文本搜索,减少不必要的文件读取。还能在编辑后自动报告类型错误,省去手动编译。
5. 用 Hooks 预处理数据
Hooks 可以在 Claude 看到数据前预处理,大幅缩减上下文。
例如:与其让 Claude 读取 10000 行日志找错误,不如用 PreToolUse hook 先 grep ERROR 行再返回:
settings.json:
json
{
"hooks": {
"PreToolUse": [
{
"matcher": "Bash",
"hooks": [
{
"type": "command",
"command": "~/.claude/hooks/filter-test-output.sh"
}
]
}
]
}
}filter-test-output.sh:
bash
#!/bin/bash
input=$(cat)
cmd=$(echo "$input" | jq -r '.tool_input.command')
if [[ "$cmd" =~ ^(npm test|pytest|go test) ]]; then
filtered_cmd="$cmd 2>&1 | grep -A 5 -E '(FAIL|ERROR|error:)' | head -100"
echo "{\"hookSpecificOutput\":{\"hookEventName\":\"PreToolUse\",\"permissionDecision\":\"allow\",\"updatedInput\":{\"command\":\"$filtered_cmd\"}}}"
else
echo "{}"
fi6. 把详细指令从 CLAUDE.md 移到 Skills
CLAUDE.md 在每次会话开始时完整加载。如果里面有 PR review、数据库迁移等详细流程,即使不用这些功能也会消耗 token。
把专项流程移到 Skills——Skills 只在调用时加载。
建议:CLAUDE.md 保持 200 行以内,只写核心规范。
7. 调整推理力度
扩展推理(extended thinking)默认开启,对复杂任务效果好但消耗多。对简单任务可以:
- 降低力度:
/effort low或在/model中调整 - 设置最大 thinking token:
MAX_THINKING_TOKENS=8000 - 在
/config关闭 thinking
8. 把大量输出委托给子代理
运行测试、抓取文档、处理日志等会产生大量输出的操作,委托给子代理处理。大量输出留在子代理上下文里,主对话只接收摘要。
9. 写具体的提示词
含糊的请求("改进这个代码库")会触发大范围扫描。具体的请求("在 auth.ts 的登录函数里添加输入验证")让 Claude 可以高效工作,只读必要的文件。
10. 用计划模式减少返工
对复杂任务,按 Shift+Tab 进入计划模式。Claude 先探索代码库、提出方案,你审批后再执行——避免方向错了浪费大量 token。
任务进行中方向偏了,按 Escape 立即停止,用 /rewind 回滚。
后台 Token 消耗
即使不主动使用,Claude Code 也会消耗少量 token 用于:
- 对话摘要:为
claude --resume功能生成历史摘要 - 命令处理:
/cost等命令可能产生少量 API 请求
每次会话的后台消耗通常低于 $0.04。
相关文档
- 模型配置 — 切换模型和调整力度
- Status Line — 实时显示上下文用量
- 子代理 — 隔离高用量操作
- Hooks 使用指南 — 预处理数据减少上下文
常见问题
Q: Claude Code 的收费标准是什么?
Claude Code 采用基于 token 消耗的按量计费模式,费用随代码库大小、查询复杂度和对话长度变化。平均费用约为每位开发者每天 6 美元,团队月均费用约 100-200 美元/开发者(使用 Sonnet 模型)。
Q: Claude Code 2024 年的最新价格是多少?
截至 2024 年,Claude Code 没有固定的订阅费,费用完全由 token 用量决定。90% 的用户日均费用低于 12 美元。具体价格需通过 /cost 命令或平台用量报告实时查看,并受所选模型(如 Sonnet 比 Opus 便宜)影响。
Q: 如何查看和追踪我的 Claude Code 使用费用?
API 用户可直接在对话中使用 /cost 命令查看当前会话的 token 用量和费用。团队管理员可在 Claude Console 的工作区设置中查看详细的成本与用量报告,并设置消费限额。
Q: Claude Code 的价格与 Claude 订阅(如 Claude Pro)有什么关系?
Claude Code 的费用独立于 Claude.ai 的 Max/Pro 订阅。订阅费用不包含 Claude Code 的使用成本。Claude Code 用户需单独为其 API 或云服务端的 token 消耗付费。
Q: 有哪些方法可以降低 Claude Code 的使用成本?
可通过主动管理会话上下文(及时用 /clear)、为简单任务选择成本更低的模型(如 Haiku)、减少不必要的 MCP 服务器、使用代码智能插件和 Hooks 预处理数据等策略,有效减少 token 消耗,从而控制成本。