Appearance
Kimi K2.6 是当前最智能的 Kimi 模型,在长程代码、Agent 和视觉理解等方向全面领先。本文提供图片理解、视频理解和多模态工具调用的完整接入示例,适合已有 OpenAI API 使用经验的开发者快速迁移。
Kimi K2.6 快速接入
K2.6 模型特性概览
| 特性 | 说明 |
|---|---|
| 上下文窗口 | 256K tokens |
| 多模态输入 | 文本 + 图片 + 视频 |
| 思考模式 | 默认启用,可禁用 |
| 工具调用 | 支持多步 Agent 流程 |
| 代码能力 | 国内领先,支持 Rust/Go/Python 等多语言 |
与 OpenAI GPT-4o 对比:同样支持多模态,但 Kimi K2.6 的 256K 上下文远超 GPT-4o 的 128K,且国内访问无需代理。
安装与配置
bash
pip install --upgrade 'openai>=1.0'python
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ.get("MOONSHOT_API_KEY"),
base_url="https://api.moonshot.cn/v1",
)图片理解
python
import os
import base64
from openai import OpenAI
client = OpenAI(
api_key=os.environ.get("MOONSHOT_API_KEY"),
base_url="https://api.moonshot.cn/v1",
)
image_path = "image.png"
with open(image_path, "rb") as f:
image_data = f.read()
ext = os.path.splitext(image_path)[1].lstrip(".")
image_url = f"data:image/{ext};base64,{base64.b64encode(image_data).decode('utf-8')}"
completion = client.chat.completions.create(
model="kimi-k2.6",
messages=[
{"role": "system", "content": "你是 Kimi。"},
{
"role": "user",
"content": [
{"type": "image_url", "image_url": {"url": image_url}},
{"type": "text", "text": "请描述图片的内容。"},
],
},
],
)
print(completion.choices[0].message.content)支持格式:png、jpeg、webp、gif。推荐分辨率不超过 4K (4096×2160),更高分辨率不会提升效果,只会增加 token 消耗。
视频理解
python
import os
import base64
from openai import OpenAI
client = OpenAI(
api_key=os.environ.get("MOONSHOT_API_KEY"),
base_url="https://api.moonshot.cn/v1",
)
video_path = "video.mp4"
with open(video_path, "rb") as f:
video_data = f.read()
ext = os.path.splitext(video_path)[1].lstrip(".")
video_url = f"data:video/{ext};base64,{base64.b64encode(video_data).decode('utf-8')}"
completion = client.chat.completions.create(
model="kimi-k2.6",
messages=[
{"role": "system", "content": "你是 Kimi。"},
{
"role": "user",
"content": [
{"type": "video_url", "video_url": {"url": video_url}},
{"type": "text", "text": "请描述视频的内容。"},
],
},
],
)
print(completion.choices[0].message.content)支持格式:mp4、mpeg、mov、avi、webm 等。推荐分辨率不超过 2K (2048×1080)。
禁用 Thinking 模式
默认情况下 K2.6 启用思考模式。如果不需要推理过程(如简单任务),可以禁用以降低 token 消耗:
python
response = client.chat.completions.create(
model="kimi-k2.6",
messages=[{"role": "user", "content": "你好"}],
extra_body={"thinking": {"type": "disabled"}},
)常见问题
Q: 如何在 Claude Code / Cline / Roo Code 等工具中使用 Kimi K2.6?
A: 参考 Agent 工具接入指南,通常只需配置 baseURL 和 API Key。
Q: 图片 base64 和文件上传哪种方式更好?
A: 对于小图片(< 5MB)直接用 base64 更简单;对于大视频或需要多次引用的资源,先用文件上传 API 上传后用 ms://<file_id> 引用,避免请求体超 100MB 限制。
Q: K2.6 思考模式下生成速度会变慢吗?
A: 是的,thinking 模式会先生成 reasoning_content,再生成最终答案,消耗更多 token 和时间。简单问答任务建议禁用 thinking 以提高响应速度。
kimi-k2.6 是 Kimi 旗舰多模态模型,支持文本、图片、视频输入,256K 上下文,兼容 OpenAI SDK。本文是最快的接入路径:获取 Key → 安装 SDK → 发起第一个请求。
Kimi K2.6 快速开始
1. 获取 API Key
2. 安装 SDK
bash
# Node.js
npm install openai
# Python
pip install openai3. 发起第一个请求
typescript
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.MOONSHOT_API_KEY,
baseURL: "https://api.moonshot.cn/v1",
});
const response = await client.chat.completions.create({
model: "kimi-k2.6",
messages: [
{ role: "system", content: "你是 Kimi,由 Moonshot AI 提供的人工智能助手。" },
{ role: "user", content: "你好!请介绍一下你自己。" },
],
});
console.log(response.choices[0].message.content);python
from openai import OpenAI
client = OpenAI(
api_key="MOONSHOT_API_KEY",
base_url="https://api.moonshot.cn/v1",
)
response = client.chat.completions.create(
model="kimi-k2.6",
messages=[
{"role": "system", "content": "你是 Kimi,由 Moonshot AI 提供的人工智能助手。"},
{"role": "user", "content": "你好!请介绍一下你自己。"},
],
)
print(response.choices[0].message.content)4. 图片理解
typescript
import fs from "fs";
const imageBuffer = fs.readFileSync("screenshot.png");
const base64Image = imageBuffer.toString("base64");
const response = await client.chat.completions.create({
model: "kimi-k2.6",
messages: [
{
role: "user",
content: [
{
type: "image_url",
image_url: { url: `data:image/png;base64,${base64Image}` },
},
{ type: "text", text: "请描述这张图片的内容。" },
],
},
],
});5. 开启思考模式
typescript
const response = await client.chat.completions.create({
model: "kimi-k2.6",
messages: [{ role: "user", content: "用归纳法证明 1+2+...+n = n(n+1)/2。" }],
temperature: 1.0, // 思考模式必须 1.0
thinking: { type: "enabled" },
} as any);
const msg = response.choices[0].message as any;
console.log("思考过程:", msg.reasoning_content);
console.log("最终答案:", msg.content);temperature 特殊要求
kimi-k2.6 对 temperature 参数有特殊要求:
| 模式 | temperature |
|---|---|
| 思考模式(thinking.type="enabled") | 必须 1.0 |
| 非思考模式(thinking.type="disabled") | 必须 0.6 |
| 不设置 thinking | 使用默认值(推荐做法) |
设置不支持的 temperature 值会报
invalid_request_error。最简单的做法是不设置 temperature,让 API 自动应用模式对应的默认值。
核心参数
| 参数 | 类型 | 说明 |
|---|---|---|
model | string | kimi-k2.6 或 kimi-k2.5 |
messages | array | 对话消息列表 |
stream | boolean | 是否流式输出,默认 false |
max_completion_tokens | integer | 最大输出 token 数,默认 1024 |
thinking | object | {type: "enabled"|"disabled"} |
response_format | object | {type: "text"|"json_object"} |
tools | array | 工具定义列表 |
完整模型列表
| 模型名称 | 上下文 | 特性 |
|---|---|---|
kimi-k2.6 | 256K | 多模态、思考模式、最新旗舰 |
kimi-k2.5 | 256K | 多模态、思考模式 |
moonshot-v1-128k | 128K | 长文档,稳定 |
moonshot-v1-32k | 32K | 中等长度,经济 |
moonshot-v1-8k | 8K | 短文本,最省钱 |
moonshot-v1-auto | 自动 | 根据输入长度自动选择 |
常见问题
Q: 我的 OpenAI 代码要改哪里才能用 Kimi?
A: 只改两处:apiKey 换成 Moonshot API Key,baseURL 加上 https://api.moonshot.cn/v1。模型名称改成 kimi-k2.6 即可。
Q: 怎么判断请求是否成功?
A: 检查 choices[0].finish_reason:"stop" 代表正常完成,"length" 代表被 token 限制截断,"tool_calls" 代表需要执行工具。
Q: 海外用户用哪个地址?
A: 海外:baseURL = "https://api.moonshot.ai/v1",API Key 来自 platform.kimi.ai。国内:baseURL = "https://api.moonshot.cn/v1",Key 来自 platform.kimi.com。两套账号独立,Key 不通用。