Appearance
DeepSeek 官方 GitHub 不只有模型仓库,还包括 API 集成清单、OCR、代码模型、多模态模型和底层推理基础设施。普通开发者优先看 awesome-deepseek-integration、DeepSeek-OCR、DeepSeek-Coder;做模型研究再看 DeepSeek-V3、DeepSeek-R1;做推理系统再看 FlashMLA、DeepEP、DeepGEMM。
DeepSeek GitHub 项目整理
DeepSeek 官方 GitHub 组织是 github.com/deepseek-ai。很多人搜“DeepSeek GitHub”,其实不是想把所有仓库都看一遍,而是想知道:哪些项目和我有关?
DeepSeek 的仓库大致分四类:
- 模型仓库。
- API 和工具集成。
- 多模态、OCR、代码、数学等专项模型。
- 训练和推理基础设施。
普通开发者不需要从最底层看起。先看和业务最接近的项目。
先看这张表
| 仓库 | 适合谁 | 你能得到什么 |
|---|---|---|
| awesome-deepseek-integration | 想把 DeepSeek 接进工具的人 | 各类软件和框架的集成入口 |
| DeepSeek-OCR | 做文档识别、PDF 转 Markdown 的人 | OCR 和视觉文本压缩方案 |
| DeepSeek-Coder | 关注代码生成的人 | 代码模型、示例和论文入口 |
| DeepSeek-V3 | 模型研究者 | V3 模型说明、论文和推理信息 |
| DeepSeek-R1 | 推理模型研究者 | R1 模型、蒸馏模型和推理能力说明 |
| Janus | 多模态研究者 | 多模态理解和生成模型 |
| FlashMLA | 推理性能工程师 | MLA 注意力内核 |
| DeepEP | 大模型系统工程师 | Expert Parallel 通信库 |
| DeepGEMM | CUDA / FP8 内核开发者 | FP8 GEMM 内核 |
| 3FS | AI 基础设施团队 | 面向训练和推理的分布式文件系统 |
普通开发者优先看什么
如果你只是想在自己的工具里用 DeepSeek,先看 awesome-deepseek-integration。它比模型仓库更实用,因为它回答的是“怎么接入现有软件”。
如果你要做图片转文字、扫描件识别、PDF 转 Markdown,看 DeepSeek-OCR。
如果你要做代码助手、代码解释、代码生成,可以看 DeepSeek-Coder,但实际产品接入时仍然建议优先走 API。
模型研究者看什么
如果你关心模型结构、训练方式、推理能力和开源权重,看:
DeepSeek-V3DeepSeek-R1DeepSeek-MathDeepSeek-Math-V2DeepSeek-Prover-V2
这类仓库适合研究和复现,不一定适合普通业务开发者直接上手。尤其是大模型权重,本地跑起来的门槛和成本都不低。
推理系统工程师看什么
如果你关心的是“怎么让模型跑得更快、更便宜”,DeepSeek 的基础设施仓库更值得看:
FlashMLA:多头潜在注意力相关内核。DeepEP:专家并行通信。DeepGEMM:FP8 GEMM 内核。3FS:AI 训练和推理场景的分布式文件系统。DualPipe:训练阶段通信和计算重叠。
这些项目不适合入门用户。它们解决的是大规模训练、推理和基础设施问题。
别把 GitHub 仓库当成产品说明书
GitHub 仓库通常服务于开发者和研究者。普通用户想知道“DeepSeek 怎么用”,应该先看官网、Chat、App 和 API 文档。
推荐路径:
text
普通用户 -> DeepSeek Chat / App
开发者接入 -> API 文档 + awesome-deepseek-integration
文档识别 -> DeepSeek-OCR
模型研究 -> DeepSeek-V3 / R1 / Math / Prover
推理基础设施 -> FlashMLA / DeepEP / DeepGEMM / 3FS常见问题
Q: DeepSeek GitHub 上的项目都能直接下载使用吗?
A: 不一定。有些是模型权重,有些是论文代码,有些是底层系统组件。能下载不等于适合直接用于业务。
Q: 我想接入 DeepSeek API,应该看哪个仓库?
A: 先看官方 API 文档,再看 awesome-deepseek-integration。不要从模型训练仓库开始。
Q: 我想本地部署,应该从哪个仓库开始?
A: 先明确任务。如果是文档识别,看 DeepSeek-OCR;如果是语言模型研究,看具体模型仓库;如果只是业务调用,优先用 API。