Skip to content

GET /v1/models 接口列出全部可用 Kimi 模型,包含上下文长度、多模态支持、推理能力等字段。各模型在 Chat Completions 中支持修改的参数不同,kimi-k2.6 限制最多(temperature/n 不可改)。本文是模型参数差异的完整对比参考。

Kimi 模型列表与参数对比

列出可用模型

GET https://api.moonshot.cn/v1/models
Authorization: Bearer {MOONSHOT_API_KEY}
python
from openai import OpenAI

client = OpenAI(
    api_key="$MOONSHOT_API_KEY",
    base_url="https://api.moonshot.cn/v1",
)

models = client.models.list()
for model in models.data:
    print(f"{model.id} - context: {getattr(model, 'context_length', 'N/A')}")

响应示例(单个模型)

json
{
  "id": "kimi-k2.5",
  "object": "model",
  "created": 1718006400,
  "owned_by": "moonshot",
  "context_length": 262144,
  "supports_image_in": true,
  "supports_video_in": true,
  "supports_reasoning": true
}

模型参数差异对比

参数kimi-k2.6kimi-k2.5kimi-k2-thinkingmoonshot-v1 系列
temperature不可改(内置)0.6(可改)1.0(可改)0~1(可改)
top_p固定 0.95可改可改可改
n不可改(固定 1)可改可改可改
presence_penalty不支持可改可改可改
frequency_penalty不支持可改可改可改
thinking✅ 支持(默认启用)✅ 支持始终启用,不可关❌ 不支持
图片输入仅 vision 系列
视频输入

kimi-k2.6 参数特殊说明

kimi-k2.6 对很多常规参数有限制:

python
# 正确:不设置 temperature(使用内置默认值)
completion = client.chat.completions.create(
    model="kimi-k2.6",
    messages=[{"role": "user", "content": "你好"}],
    max_tokens=4096,
)

# 错误:显式设置 temperature 会报错
# completion = client.chat.completions.create(
#     model="kimi-k2.6",
#     messages=[...],
#     temperature=0.8,  # ❌ invalid_request_error
# )

thinking 参数(通过 extra_body 传递):

python
# 禁用思考模式(减少 token 消耗,提高速度)
completion = client.chat.completions.create(
    model="kimi-k2.6",
    messages=[{"role": "user", "content": "你好"}],
    extra_body={"thinking": {"type": "disabled"}},
)

# 启用并设置预算
extra_body={"thinking": {"type": "enabled", "budget_tokens": 8192}}

常见问题

Q: 如何知道某个模型的最大上下文长度?

A: 调用 GET /v1/models 后查看响应中的 context_length 字段,或参考 Kimi 模型列表 中的对比表格。

Q: temperature 接近 0 时有什么限制?

A: 当 temperature 接近 0 时,n 参数只能为 1,设置 n > 1 会返回 invalid_request_error

Q: moonshot-v1 和 kimi-k2 系列如何选择?

A: moonshot-v1 系列参数更灵活(支持自定义 temperature、presence_penalty 等),适合需要精细调参的场景;kimi-k2.6 能力更强但参数固定,适合追求最佳效果且不需要参数微调的场景。