Skip to content

Kimi K2.6 是当前最智能的 Kimi 模型,在长程代码、Agent 和视觉理解等方向全面领先。本文提供图片理解、视频理解和多模态工具调用的完整接入示例,适合已有 OpenAI API 使用经验的开发者快速迁移。

Kimi K2.6 快速接入

K2.6 模型特性概览

特性说明
上下文窗口256K tokens
多模态输入文本 + 图片 + 视频
思考模式默认启用,可禁用
工具调用支持多步 Agent 流程
代码能力国内领先,支持 Rust/Go/Python 等多语言

与 OpenAI GPT-4o 对比:同样支持多模态,但 Kimi K2.6 的 256K 上下文远超 GPT-4o 的 128K,且国内访问无需代理。


安装与配置

bash
pip install --upgrade 'openai>=1.0'
python
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ.get("MOONSHOT_API_KEY"),
    base_url="https://api.moonshot.cn/v1",
)

图片理解

python
import os
import base64
from openai import OpenAI

client = OpenAI(
    api_key=os.environ.get("MOONSHOT_API_KEY"),
    base_url="https://api.moonshot.cn/v1",
)

image_path = "image.png"
with open(image_path, "rb") as f:
    image_data = f.read()

ext = os.path.splitext(image_path)[1].lstrip(".")
image_url = f"data:image/{ext};base64,{base64.b64encode(image_data).decode('utf-8')}"

completion = client.chat.completions.create(
    model="kimi-k2.6",
    messages=[
        {"role": "system", "content": "你是 Kimi。"},
        {
            "role": "user",
            "content": [
                {"type": "image_url", "image_url": {"url": image_url}},
                {"type": "text", "text": "请描述图片的内容。"},
            ],
        },
    ],
)

print(completion.choices[0].message.content)

支持格式:png、jpeg、webp、gif。推荐分辨率不超过 4K (4096×2160),更高分辨率不会提升效果,只会增加 token 消耗。


视频理解

python
import os
import base64
from openai import OpenAI

client = OpenAI(
    api_key=os.environ.get("MOONSHOT_API_KEY"),
    base_url="https://api.moonshot.cn/v1",
)

video_path = "video.mp4"
with open(video_path, "rb") as f:
    video_data = f.read()

ext = os.path.splitext(video_path)[1].lstrip(".")
video_url = f"data:video/{ext};base64,{base64.b64encode(video_data).decode('utf-8')}"

completion = client.chat.completions.create(
    model="kimi-k2.6",
    messages=[
        {"role": "system", "content": "你是 Kimi。"},
        {
            "role": "user",
            "content": [
                {"type": "video_url", "video_url": {"url": video_url}},
                {"type": "text", "text": "请描述视频的内容。"},
            ],
        },
    ],
)

print(completion.choices[0].message.content)

支持格式:mp4、mpeg、mov、avi、webm 等。推荐分辨率不超过 2K (2048×1080)。


禁用 Thinking 模式

默认情况下 K2.6 启用思考模式。如果不需要推理过程(如简单任务),可以禁用以降低 token 消耗:

python
response = client.chat.completions.create(
    model="kimi-k2.6",
    messages=[{"role": "user", "content": "你好"}],
    extra_body={"thinking": {"type": "disabled"}},
)

常见问题

Q: 如何在 Claude Code / Cline / Roo Code 等工具中使用 Kimi K2.6?

A: 参考 Agent 工具接入指南,通常只需配置 baseURL 和 API Key。

Q: 图片 base64 和文件上传哪种方式更好?

A: 对于小图片(< 5MB)直接用 base64 更简单;对于大视频或需要多次引用的资源,先用文件上传 API 上传后用 ms://<file_id> 引用,避免请求体超 100MB 限制。

Q: K2.6 思考模式下生成速度会变慢吗?

A: 是的,thinking 模式会先生成 reasoning_content,再生成最终答案,消耗更多 token 和时间。简单问答任务建议禁用 thinking 以提高响应速度。

kimi-k2.6 是 Kimi 旗舰多模态模型,支持文本、图片、视频输入,256K 上下文,兼容 OpenAI SDK。本文是最快的接入路径:获取 Key → 安装 SDK → 发起第一个请求。

Kimi K2.6 快速开始

1. 获取 API Key

2. 安装 SDK

bash
# Node.js
npm install openai

# Python
pip install openai

3. 发起第一个请求

typescript
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.cn/v1",
});

const response = await client.chat.completions.create({
  model: "kimi-k2.6",
  messages: [
    { role: "system", content: "你是 Kimi,由 Moonshot AI 提供的人工智能助手。" },
    { role: "user", content: "你好!请介绍一下你自己。" },
  ],
});

console.log(response.choices[0].message.content);
python
from openai import OpenAI

client = OpenAI(
    api_key="MOONSHOT_API_KEY",
    base_url="https://api.moonshot.cn/v1",
)

response = client.chat.completions.create(
    model="kimi-k2.6",
    messages=[
        {"role": "system", "content": "你是 Kimi,由 Moonshot AI 提供的人工智能助手。"},
        {"role": "user", "content": "你好!请介绍一下你自己。"},
    ],
)

print(response.choices[0].message.content)

4. 图片理解

typescript
import fs from "fs";

const imageBuffer = fs.readFileSync("screenshot.png");
const base64Image = imageBuffer.toString("base64");

const response = await client.chat.completions.create({
  model: "kimi-k2.6",
  messages: [
    {
      role: "user",
      content: [
        {
          type: "image_url",
          image_url: { url: `data:image/png;base64,${base64Image}` },
        },
        { type: "text", text: "请描述这张图片的内容。" },
      ],
    },
  ],
});

5. 开启思考模式

typescript
const response = await client.chat.completions.create({
  model: "kimi-k2.6",
  messages: [{ role: "user", content: "用归纳法证明 1+2+...+n = n(n+1)/2。" }],
  temperature: 1.0, // 思考模式必须 1.0
  thinking: { type: "enabled" },
} as any);

const msg = response.choices[0].message as any;
console.log("思考过程:", msg.reasoning_content);
console.log("最终答案:", msg.content);

temperature 特殊要求

kimi-k2.6 对 temperature 参数有特殊要求:

模式temperature
思考模式(thinking.type="enabled")必须 1.0
非思考模式(thinking.type="disabled")必须 0.6
不设置 thinking使用默认值(推荐做法)

设置不支持的 temperature 值会报 invalid_request_error。最简单的做法是不设置 temperature,让 API 自动应用模式对应的默认值。

核心参数

参数类型说明
modelstringkimi-k2.6kimi-k2.5
messagesarray对话消息列表
streamboolean是否流式输出,默认 false
max_completion_tokensinteger最大输出 token 数,默认 1024
thinkingobject{type: "enabled"|"disabled"}
response_formatobject{type: "text"|"json_object"}
toolsarray工具定义列表

完整模型列表

模型名称上下文特性
kimi-k2.6256K多模态、思考模式、最新旗舰
kimi-k2.5256K多模态、思考模式
moonshot-v1-128k128K长文档,稳定
moonshot-v1-32k32K中等长度,经济
moonshot-v1-8k8K短文本,最省钱
moonshot-v1-auto自动根据输入长度自动选择

常见问题

Q: 我的 OpenAI 代码要改哪里才能用 Kimi?

A: 只改两处:apiKey 换成 Moonshot API Key,baseURL 加上 https://api.moonshot.cn/v1。模型名称改成 kimi-k2.6 即可。

Q: 怎么判断请求是否成功?

A: 检查 choices[0].finish_reason"stop" 代表正常完成,"length" 代表被 token 限制截断,"tool_calls" 代表需要执行工具。

Q: 海外用户用哪个地址?

A: 海外:baseURL = "https://api.moonshot.ai/v1",API Key 来自 platform.kimi.ai。国内:baseURL = "https://api.moonshot.cn/v1",Key 来自 platform.kimi.com。两套账号独立,Key 不通用。