Batch API 提供标准在线推理价格的 60% 折扣，适合大规模非实时任务（数据处理、批量内容生成等）。牺牲实时性换低价，任务在 12h~7d 内完成。

Kimi Batch API 定价

价格表

模型	输入（缓存命中）	输入（缓存未命中）	输出
kimi-k2.6 (Batch)	¥0.66	¥3.90	¥16.20
kimi-k2.5 (Batch)	¥0.42	¥2.40	¥12.60

价格单位：每 1M tokens

Batch API 价格 = 标准价格 × 60%

与在线推理价格对比

模型	在线推理（输出）	Batch API（输出）	节省
kimi-k2.6	¥27.00	¥16.20	40%
kimi-k2.5	¥21.00	¥12.60	40%

适用场景

Batch API 适合：

大批量数据分析（如对几千条数据进行分类/摘要）
内容批量生成（文章、评论、标题）
知识库批量向量化（结合其他 embedding 服务）
不需要实时响应的离线处理任务

不适合：

需要用户即时交互的场景
需要流式输出显示进度的任务
任务链中有依赖关系（后一个任务依赖前一个结果）

使用方式

参考 Batch API 完整指南，核心步骤：

准备 JSONL 格式的请求文件
上传文件（purpose=batch）
创建批任务（POST /v1/batches）
轮询状态直到 completed
下载结果文件

常见问题

Q: Batch API 任务最长等待多久？

A: 取决于 completion_window 设置（12h~7d），实际完成时间通常比设定窗口短很多。如果超过窗口时间仍未完成，任务变为 expired 状态，需重新提交。

Q: Batch API 任务失败了会收费吗？

A: 只对成功处理的请求收费。失败的请求（如格式错误、模型报错）不计费。可在 request_counts.failed 字段查看失败数量。

Q: 能用 Batch API 处理多模态（图片/视频）任务吗？

A: 可以，kimi-k2.5/k2.6 的 Batch API 支持多模态输入，在 JSONL 文件中按正常多模态消息格式编写即可。

AI 工具接入

模型能力

高级功能

集成与工具

运维与稳定性

GitHub MCP Server

设置与安装

用量与账单管理

模型切换

Cloud Agent（云端 AI 代理）

Copilot CLI

CLI 自定义总览

CLI 安装与配置

CLI 自动化

CLI Agent 使用

Copilot SDK

认证配置

故障排查

集成与可观测性

Cloud Agent 任务工作流

自定义与 Spaces

启用与配置（set-up）

启用 Copilot

Prompt 工程

代码补全

工具集成

Agent 系统

Copilot CLI 核心概念

计费说明

上下文与索引

语言与框架

Learn by Playing

Terminal UI

Privacy & Security

Custom Agents 详解

CLI 计费管理

CLI Enterprise

CLI Chat

CLI MCP

CLI Reference

Experimental

Kimi Batch API 定价 ​

价格表 ​

与在线推理价格对比 ​

适用场景 ​

使用方式 ​

常见问题 ​

Kimi Batch API 定价

价格表

与在线推理价格对比

适用场景

使用方式

常见问题