Skip to content

2025-03-24,DeepSeek-V3-0324 发布。本次仅更新后训练(Post-training),基础模型不变。核心提升:引入 R1 强化学习方法,数学和代码基准超越 GPT-4.5;中文写作质量升级;搜索报告、工具使用和 Function Calling 能力增强。660B 参数,MIT 许可证开源。

DeepSeek V3-0324 发布(2025-03-24)

核心更新

  • 推理能力提升:引入 DeepSeek-R1 的强化学习方法,数学和代码基准超越 GPT-4.5
  • 前端开发能力:网页前端代码生成质量明显提升
  • 中文写作:内容质量和流畅度升级
  • 搜索相关报告生成能力增强
  • 工具使用和多轮对话更稳定
  • JSON Output 和 Function Calling 能力增强
  • 128K 上下文窗口(API 和 App 端为 64K)

关于本次更新

仅更新了 Post-training(后训练)部分,基础模型权重不变。开源用户私有部署时需更新 checkpoint 和 tokenizer 配置,下载地址:ModelScope 和 HuggingFace。

API 访问

通过 deepseek-chat 端点访问最新版 V3-0324,接口无变化。

查看完整更新历史:DeepSeek API 更新日志