Skip to content

DeepSeek 官方 GitHub 不只有模型仓库,还包括 API 集成清单、OCR、代码模型、多模态模型和底层推理基础设施。普通开发者优先看 awesome-deepseek-integration、DeepSeek-OCR、DeepSeek-Coder;做模型研究再看 DeepSeek-V3、DeepSeek-R1;做推理系统再看 FlashMLA、DeepEP、DeepGEMM。

DeepSeek GitHub 项目整理

DeepSeek 官方 GitHub 组织是 github.com/deepseek-ai。很多人搜“DeepSeek GitHub”,其实不是想把所有仓库都看一遍,而是想知道:哪些项目和我有关?

DeepSeek 的仓库大致分四类:

  1. 模型仓库。
  2. API 和工具集成。
  3. 多模态、OCR、代码、数学等专项模型。
  4. 训练和推理基础设施。

普通开发者不需要从最底层看起。先看和业务最接近的项目。

先看这张表

仓库适合谁你能得到什么
awesome-deepseek-integration想把 DeepSeek 接进工具的人各类软件和框架的集成入口
DeepSeek-OCR做文档识别、PDF 转 Markdown 的人OCR 和视觉文本压缩方案
DeepSeek-Coder关注代码生成的人代码模型、示例和论文入口
DeepSeek-V3模型研究者V3 模型说明、论文和推理信息
DeepSeek-R1推理模型研究者R1 模型、蒸馏模型和推理能力说明
Janus多模态研究者多模态理解和生成模型
FlashMLA推理性能工程师MLA 注意力内核
DeepEP大模型系统工程师Expert Parallel 通信库
DeepGEMMCUDA / FP8 内核开发者FP8 GEMM 内核
3FSAI 基础设施团队面向训练和推理的分布式文件系统

普通开发者优先看什么

如果你只是想在自己的工具里用 DeepSeek,先看 awesome-deepseek-integration。它比模型仓库更实用,因为它回答的是“怎么接入现有软件”。

如果你要做图片转文字、扫描件识别、PDF 转 Markdown,看 DeepSeek-OCR

如果你要做代码助手、代码解释、代码生成,可以看 DeepSeek-Coder,但实际产品接入时仍然建议优先走 API。

模型研究者看什么

如果你关心模型结构、训练方式、推理能力和开源权重,看:

  • DeepSeek-V3
  • DeepSeek-R1
  • DeepSeek-Math
  • DeepSeek-Math-V2
  • DeepSeek-Prover-V2

这类仓库适合研究和复现,不一定适合普通业务开发者直接上手。尤其是大模型权重,本地跑起来的门槛和成本都不低。

推理系统工程师看什么

如果你关心的是“怎么让模型跑得更快、更便宜”,DeepSeek 的基础设施仓库更值得看:

  • FlashMLA:多头潜在注意力相关内核。
  • DeepEP:专家并行通信。
  • DeepGEMM:FP8 GEMM 内核。
  • 3FS:AI 训练和推理场景的分布式文件系统。
  • DualPipe:训练阶段通信和计算重叠。

这些项目不适合入门用户。它们解决的是大规模训练、推理和基础设施问题。

别把 GitHub 仓库当成产品说明书

GitHub 仓库通常服务于开发者和研究者。普通用户想知道“DeepSeek 怎么用”,应该先看官网、Chat、App 和 API 文档。

推荐路径:

text
普通用户 -> DeepSeek Chat / App
开发者接入 -> API 文档 + awesome-deepseek-integration
文档识别 -> DeepSeek-OCR
模型研究 -> DeepSeek-V3 / R1 / Math / Prover
推理基础设施 -> FlashMLA / DeepEP / DeepGEMM / 3FS

常见问题

Q: DeepSeek GitHub 上的项目都能直接下载使用吗?

A: 不一定。有些是模型权重,有些是论文代码,有些是底层系统组件。能下载不等于适合直接用于业务。

Q: 我想接入 DeepSeek API,应该看哪个仓库?

A: 先看官方 API 文档,再看 awesome-deepseek-integration。不要从模型训练仓库开始。

Q: 我想本地部署,应该从哪个仓库开始?

A: 先明确任务。如果是文档识别,看 DeepSeek-OCR;如果是语言模型研究,看具体模型仓库;如果只是业务调用,优先用 API。