Skip to content

2024-12-26,DeepSeek-V3 正式发布并开源。671B 参数 MoE 架构(37B 激活),训练 14.8T tokens,生成速度提升至 60 TPS。在知识、代码、数学、中文等多项基准测试中超越同量级开源模型,比肩 GPT-4o 和 Claude-3.5-Sonnet。

DeepSeek V3 正式上线(2024-12-26)

核心数据

指标数值
总参数671B
激活参数37B(MoE 架构)
训练 token 数14.8T
生成速度60 TPS(原 V2 为 20 TPS,提升 3 倍)
上下文128K(API/App 为 64K)

性能亮点

在知识类、长文本、代码生成、数学推理、中文语言等多项基准测试中:

  • 超越同量级开源模型(Qwen2.5-72B、Llama-3.1-405B)
  • 性能比肩顶级闭源系统(GPT-4o、Claude-3.5-Sonnet)

API 访问

通过 deepseek-chat 端点访问,接口无变化:

typescript
const response = await client.chat.completions.create({
  model: "deepseek-chat",  // 升级为 V3
  messages: [{ role: "user", content: "你好" }],
});

价格

  • 输入:0.5元/M tokens(缓存命中),2元(未命中)
  • 输出:8元/M tokens
  • 新用户/老用户首 45 天促销:最低输入 0.1元,输出 2元(至 2025-02-08)

开源

FP8 训练权重完全开源,支持 SGLang、LMDeploy、TensorRT-LLM 等框架部署。

查看完整更新历史:DeepSeek API 更新日志