在 Hugging Face Hub 上高效发布与管理研究论文

解决学术成果发布碎片化问题:通过 AI 自动化工作流,将 arXiv 论文快速索引至 Hugging Face Hub,并建立论文与实际模型、数据集之间的双向链接,提升研究影响力的可见度。

为什么需要这个技能

对于 AI 研究员,论文发表后往往需要手动在 Hugging Face 的 Model Card 或 Dataset Card 中添加引用。手动操作不仅繁琐,且容易导致元数据格式不统一,难以被 Hub 的搜索系统自动索引。

本技能通过脚本化操作,实现了从“论文写作 arXiv 索引 模型关联 作者认领”的闭环管理。它不仅能自动生成符合标准的 YAML 元数据,还能利用专业模板快速构建现代化的 Markdown 研究文章,让你的研究成果在 HF 生态中更具专业度。

适用场景

  • 新论文发布:论文提交 arXiv 后,需要快速在 HF Hub 建立 Paper Page。
  • 成果关联:需要将多篇论文与特定的模型权重(Model)或训练集(Dataset)进行绑定。
  • 个人主页维护:在 HF 个人 profile 中展示已验证的作者身份及论文列表。
  • 快速原型写作:需要一个结构标准(含摘要、方法、实验等)的科学论文 Markdown 模板。

核心工作流

1. 索引与关联

通过 paper_manager.py 脚本,利用 arXiv ID 将论文导入 HF 体系,并将其注入到指定仓库的 README 中。

# 索引 arXiv 论文
uv run scripts/paper_manager.py index --arxiv-id "2301.12345"

# 将论文关联至模型仓库(自动更新 YAML 元数据)
uv run scripts/paper_manager.py link \
  --repo-id "username/model-name" \
  --repo-type "model" \
  --arxiv-id "2301.12345"

2. 作者身份认领

通过验证机构邮箱,在 HF Hub 上正式认领论文作者身份,使其出现在个人主页。

uv run scripts/paper_manager.py claim \
  --arxiv-id "2301.12345" \
  --email "your.email@institution.edu"

3. 研究文章创作

利用内置模板(如 modernstandard)快速生成 lTeX 兼容的 Markdown 文档,并可一键转换为 HTML。

# 创建基于现代模板的论文草稿
uv run scripts/paper_manager.py create \
  --template "modern" \
  --title "Your Paper Title" \
  --output "paper.md"

# 转换为 HTML 网页版
uv run scripts/paper_manager.py convert --input "paper.md" --output "paper.html"

下载和安装

下载 hugging-face-paper-publisher 中文版 Skill ZIP

解压后将目录放入你的 AI 工具 skills 文件夹,重启工具后即可使用。使用前请确保已配置具有写权限的 HF_TOKEN 环境变量。

你可能还需要

暂无推荐