Skip to content

批量推理是 Kimi 开放平台的无代码批量处理功能,Tier1 用户通过控制台上传数据文件即可提交批量任务,完成后下载输出文件。与 Batch API 相比,控制台方式无需编程,适合数据分析师和运营人员。

Kimi 批量推理(控制台版)

与 Batch API 的区别

方式操作难度适合人群灵活性
控制台批量推理无需编程数据分析师、运营固定工作流
Batch API需要写代码开发者完全自定义

权限要求

批量推理功能需要 Tier1 及以上用户权限。如果还未达到,可通过充值或完成企业认证升级。


操作步骤

1. 进入批量推理

  1. 登录 platform.kimi.com
  2. 进入「用户中心」→「项目管理」
  3. 选择目标项目
  4. 点击「批量推理」选项卡
  5. 点击「创建批任务」

2. 配置批量任务

在弹窗中填写:

  • 批量任务名称:便于后续识别
  • 最长等待时间:超时后任务自动终止
  • 数据文件:上传包含请求数据的文件(JSONL 格式)

数据文件格式参考 Batch API 文档 中的 JSONL 格式说明。

3. 提交并监控

提交后可在批量推理列表查看任务状态:

状态说明
排队中任务在队列等待执行
执行中正在处理请求
已完成处理结束,可下载结果
失败任务异常,可查看错误原因

4. 下载结果

任务完成后,点击「详情」查看任务统计信息,并下载输出结果文件(JSONL 格式)。

历史的输入和输出文件也可以在项目的「文件」页面查找。


常见问题

Q: 批量推理控制台提交和 Batch API 提交的结果格式一样吗?

A: 是的,输出文件都是 JSONL 格式,每行对应一个请求的响应结果。格式与 Batch API 输出 完全一致,可以用同样的解析代码处理。

Q: 批量推理任务排队时间很长怎么办?

A: 批量推理使用较低优先级队列(成本是在线推理的 50%),延迟可能较高。如有实时性要求,建议改用普通 API + 自行并发控制。

Q: Tier1 权限如何升级?

A: 在 platform.kimi.com 完成账号充值(充值满一定金额即可升级 Tier)或完成企业认证均可获得更高权限。具体要求见控制台的「账号等级」说明。