Appearance
2025-05-28,deepseek-reasoner 模型升级为 R1-0528。重点改进:AIME 2025 准确率 70% → 87.5%,创造推理里程碑;R1 首次支持 JSON Output 和 Function Calling(非思考模式);幻觉率降低 45-50%;max_tokens 最大扩展至 64K。
DeepSeek R1-0528 发布(2025-05-28)
核心更新
- 推理能力大幅提升:AIME 2025 准确率 70% → 87.5%,平均思考 token 从 12K 增至 23K
- R1 首次支持 Function Calling 和 JSON Output(非思考模式下)
- 幻觉率降低 45-50%
- 更长、更丰富的创意写作输出
max_tokens最大可设置至 64K
新增 Function Calling 支持
R1 之前不支持工具调用。R1-0528 起,在非思考模式下可使用工具:
typescript
const response = await client.chat.completions.create({
model: "deepseek-reasoner", // 或 deepseek-v4-pro 开启思考模式
// 非思考模式下才能用工具(R1-0528 之前全不支持)
thinking: { type: "disabled" },
tools: [
{
type: "function",
function: {
name: "calculate",
parameters: { type: "object", properties: { expr: { type: "string" } } },
},
},
],
messages: [{ role: "user", content: "计算 123 * 456" }],
});性能基准
| 基准 | 旧版 | R1-0528 |
|---|---|---|
| AIME 2025 | 70.0% | 87.5% |
| Tau-Bench airline | — | 53.5% |
| Tau-Bench retail | — | 63.9% |
查看完整更新历史:DeepSeek API 更新日志