Appearance
批量推理是 Kimi 开放平台的无代码批量处理功能,Tier1 用户通过控制台上传数据文件即可提交批量任务,完成后下载输出文件。与 Batch API 相比,控制台方式无需编程,适合数据分析师和运营人员。
Kimi 批量推理(控制台版)
与 Batch API 的区别
| 方式 | 操作难度 | 适合人群 | 灵活性 |
|---|---|---|---|
| 控制台批量推理 | 无需编程 | 数据分析师、运营 | 固定工作流 |
| Batch API | 需要写代码 | 开发者 | 完全自定义 |
权限要求
批量推理功能需要 Tier1 及以上用户权限。如果还未达到,可通过充值或完成企业认证升级。
操作步骤
1. 进入批量推理
- 登录 platform.kimi.com
- 进入「用户中心」→「项目管理」
- 选择目标项目
- 点击「批量推理」选项卡
- 点击「创建批任务」
2. 配置批量任务
在弹窗中填写:
- 批量任务名称:便于后续识别
- 最长等待时间:超时后任务自动终止
- 数据文件:上传包含请求数据的文件(JSONL 格式)
数据文件格式参考 Batch API 文档 中的 JSONL 格式说明。
3. 提交并监控
提交后可在批量推理列表查看任务状态:
| 状态 | 说明 |
|---|---|
| 排队中 | 任务在队列等待执行 |
| 执行中 | 正在处理请求 |
| 已完成 | 处理结束,可下载结果 |
| 失败 | 任务异常,可查看错误原因 |
4. 下载结果
任务完成后,点击「详情」查看任务统计信息,并下载输出结果文件(JSONL 格式)。
历史的输入和输出文件也可以在项目的「文件」页面查找。
常见问题
Q: 批量推理控制台提交和 Batch API 提交的结果格式一样吗?
A: 是的,输出文件都是 JSONL 格式,每行对应一个请求的响应结果。格式与 Batch API 输出 完全一致,可以用同样的解析代码处理。
Q: 批量推理任务排队时间很长怎么办?
A: 批量推理使用较低优先级队列(成本是在线推理的 50%),延迟可能较高。如有实时性要求,建议改用普通 API + 自行并发控制。
Q: Tier1 权限如何升级?
A: 在 platform.kimi.com 完成账号充值(充值满一定金额即可升级 Tier)或完成企业认证均可获得更高权限。具体要求见控制台的「账号等级」说明。