Appearance
2025-03-24,DeepSeek-V3-0324 发布。本次仅更新后训练(Post-training),基础模型不变。核心提升:引入 R1 强化学习方法,数学和代码基准超越 GPT-4.5;中文写作质量升级;搜索报告、工具使用和 Function Calling 能力增强。660B 参数,MIT 许可证开源。
DeepSeek V3-0324 发布(2025-03-24)
核心更新
- 推理能力提升:引入 DeepSeek-R1 的强化学习方法,数学和代码基准超越 GPT-4.5
- 前端开发能力:网页前端代码生成质量明显提升
- 中文写作:内容质量和流畅度升级
- 搜索相关报告生成能力增强
- 工具使用和多轮对话更稳定
- JSON Output 和 Function Calling 能力增强
- 128K 上下文窗口(API 和 App 端为 64K)
关于本次更新
仅更新了 Post-training(后训练)部分,基础模型权重不变。开源用户私有部署时需更新 checkpoint 和 tokenizer 配置,下载地址:ModelScope 和 HuggingFace。
API 访问
通过 deepseek-chat 端点访问最新版 V3-0324,接口无变化。
查看完整更新历史:DeepSeek API 更新日志