kimi-k2.6 是 Kimi 当前旗舰模型，输入价最低可降至 ¥1.10/1M（缓存命中），输出 ¥27.00/1M。支持 256k 上下文、图片/视频输入、Thinking 模式和联网搜索（额外 ¥0.03/次）。

Kimi K2.6 定价

价格表

计费项	价格（每 1M tokens）
输入（缓存命中）	¥1.10
输入（缓存未命中）	¥6.50
输出	¥27.00
联网搜索（$web_search）	¥0.03 / 次

上下文窗口：262,144 tokens（256K）

支持的功能

✅ 文本输入
✅ 图片输入
✅ 视频输入
✅ Thinking（深度推理）模式
✅ 工具调用（Tool Calls）
✅ JSON Mode
✅ Partial Mode
✅ 联网搜索（$web_search，额外计费）
✅ 自动 KV 上下文缓存

自动 KV 缓存说明

kimi-k2.6 支持自动上下文缓存，无需手动配置：

相同前缀的 token 被自动缓存
缓存命中的 token 按 ¥1.10/1M 计费（节省约 83%）
缓存命中率可在控制台的费用明细中查看

典型节省场景：

固定 system prompt + 多轮对话（每轮都命中 system prompt 缓存）
相同文档 + 多个问题（文档内容一次缓存，多次复用）

与其他模型对比

模型	输入（未命中）	输出	上下文	视频支持
kimi-k2.6	¥6.50	¥27.00	256K	✅
kimi-k2.5	¥4.00	¥21.00	256K	✅
moonshot-v1-128k	¥10.00	¥30.00	128K	❌
moonshot-v1-8k	¥2.00	¥10.00	8K	❌

kimi-k2.5 比 k2.6 便宜约 40%，能力略弱，适合不需要最强推理的任务。

常见问题

Q: Thinking 模式的 reasoning_content 也计费吗？

A: 是的，reasoning_content 的 token 数量按输出价格计费，且 Thinking 模式的 reasoning 可能消耗大量 token，建议用 budget_tokens 参数控制思考量。

Q: 如何预估一次请求的费用？

A: 使用 Token 预估接口获取 total_tokens，再乘以对应价格。注意需分别计算输入和输出 token（价格不同）。

Q: 联网搜索失败是否也计费？

A: 触发工具调用（finish_reason = tool_calls + $web_search）时就计费，无论搜索是否成功返回结果。如果没有触发工具调用，则不收取联网搜索费用。

AI 工具接入

模型能力

高级功能

集成与工具

运维与稳定性

GitHub MCP Server

设置与安装

用量与账单管理

模型切换

Cloud Agent（云端 AI 代理）

Copilot CLI

CLI 自定义总览

CLI 安装与配置

CLI 自动化

CLI Agent 使用

Copilot SDK

认证配置

故障排查

集成与可观测性

Cloud Agent 任务工作流

自定义与 Spaces

启用与配置（set-up）

启用 Copilot

Prompt 工程

代码补全

工具集成

Agent 系统

Copilot CLI 核心概念

计费说明

上下文与索引

语言与框架

Learn by Playing

Terminal UI

Privacy & Security

Custom Agents 详解

CLI 计费管理

CLI Enterprise

CLI Chat

CLI MCP

CLI Reference

Experimental

Kimi K2.6 定价 ​

价格表 ​

支持的功能 ​

自动 KV 缓存说明 ​

与其他模型对比 ​

常见问题 ​

Kimi K2.6 定价

价格表

支持的功能

自动 KV 缓存说明

与其他模型对比

常见问题