Appearance
2024-12-26,DeepSeek-V3 正式发布并开源。671B 参数 MoE 架构(37B 激活),训练 14.8T tokens,生成速度提升至 60 TPS。在知识、代码、数学、中文等多项基准测试中超越同量级开源模型,比肩 GPT-4o 和 Claude-3.5-Sonnet。
DeepSeek V3 正式上线(2024-12-26)
核心数据
| 指标 | 数值 |
|---|---|
| 总参数 | 671B |
| 激活参数 | 37B(MoE 架构) |
| 训练 token 数 | 14.8T |
| 生成速度 | 60 TPS(原 V2 为 20 TPS,提升 3 倍) |
| 上下文 | 128K(API/App 为 64K) |
性能亮点
在知识类、长文本、代码生成、数学推理、中文语言等多项基准测试中:
- 超越同量级开源模型(Qwen2.5-72B、Llama-3.1-405B)
- 性能比肩顶级闭源系统(GPT-4o、Claude-3.5-Sonnet)
API 访问
通过 deepseek-chat 端点访问,接口无变化:
typescript
const response = await client.chat.completions.create({
model: "deepseek-chat", // 升级为 V3
messages: [{ role: "user", content: "你好" }],
});价格
- 输入:0.5元/M tokens(缓存命中),2元(未命中)
- 输出:8元/M tokens
- 新用户/老用户首 45 天促销:最低输入 0.1元,输出 2元(至 2025-02-08)
开源
FP8 训练权重完全开源,支持 SGLang、LMDeploy、TensorRT-LLM 等框架部署。
查看完整更新历史:DeepSeek API 更新日志