站长自营 API 中转

正在比较模型套餐?可以把多个 AI API 接到一个网关里

ZZSwitch 是我自己运营的统一 API 网关,适合需要国内支付、兑换码充值、多模型切换和 OpenAI 兼容接口的开发者。不是 OpenCode 官方服务。

DeepSeek 提供 deepseek-v4-flash 和 deepseek-v4-pro 两个模型,均支持 1M 上下文。V4-Pro 目前享 2.5 折优惠(至 2026/05/31),配合 KV Cache 命中价格,是目前主流 API 中性价比最高的选项之一。

DeepSeek API 价格

当前价格表

模型 输入(缓存命中) 输入(缓存未命中) 输出
deepseek-v4-flash 0.02元/M 1元/M 2元/M
deepseek-v4-pro 0.025元/M 0.1 3元/M 12 6元/M 24

V4-Pro 当前享 2.5 折优惠,截止 2026/05/31 23:59。优惠结束后价格恢复原价。

上下文规格:

  • 最大上下文长度:1M tokens
  • 最大输出长度:384K tokens

费用计算规则

  • token 消耗量 × 模型单价 实时扣费
  • 优先扣减赠送余额,再扣现金余额
  • KV Cache 命中(上下文硬盘缓存)享最低价,反复调用相同前缀时自动生效

性价比分析

flash vs pro 怎么选?

场景 推荐模型 理由
简单问答、摘要、分类 flash 成本低 50 倍
复杂推理、代码生成 pro 质量更高
Agent 多轮对话(长前缀) pro + KV Cache 命中缓存后 pro 成本与 flash 接近
高并发批处理 flash 限速更宽松

与竞品对比(输入价格,M token):

DeepSeek V4-Pro(优惠期) OpenAI GPT-4o Claude 3.5 Sonnet
输入(缓存未命中) 3元 ~30元 ~20元
输入(缓存命中) 0.025元 ~15元 ~2元
1M 上下文支持 ❌(128K) ❌(200K)

KV Cache(上下文硬盘缓存)

DeepSeek 会自动缓存最近调用的上下文前缀。当你的请求前缀与之前完全一致时,触发缓存命中,价格降至 0.025元/M(pro)或 0.02元/M(flash)。

适合场景:

  • 固定 system prompt 的 Agent
  • 多轮对话(历史消息重复传入)
  • 文档问答(文档内容固定在前缀)

详见:上下文硬盘缓存

常见问题

Q: 如何查看当前账户余额?

A: 通过 API 查询:GET https://api.deepseek.com/user/balance,或在 平台控制台 直接查看。余额不足时 API 返回 HTTP 402 错误。

Q: V4-Pro 优惠结束后价格会涨多少?

A: 当前优惠是 2.5 折,优惠结束后输入价格从 3元/M 涨至 12元/M,输出从 6元/M 涨至 24元/M。如果有长期项目,建议在优惠期内充值锁定余额。

Q: deepseek-v4-flash 的质量够用吗?

A: 对于多数生产场景(摘要、分类、简单 QA、格式化输出)够用。复杂代码生成或需要推理链的任务建议用 pro。

站长自营 API 中转

ZZSwitch API 中转

统一接入多家模型,支持兑换码充值。

打开 ZZSwitch