使用 Firecrawl 实现深度网页爬取与内容提取

解决传统爬虫难以处理的动态页面提取问题：通过 Firecrawl API 让 AI 能够执行点击、滚动等交互操作，并支持将网页直接转换为结构化文本、截图或 PDF。

为什么需要这个技能

传统的网页抓取工具在面对现代单页应用（SPA）或需要 JS 渲染的动态页面时，往往只能抓取到空白页或不完整的 HTML。此外，将网页内容转化为 AI 易于理解的 Markdown 格式通常需要复杂的清洗过程。

Firecrawl 屏蔽了底层浏览器驱动的复杂性，提供了强大的 API 来处理深层爬取（Deep Crawling）和页面交互。通过集成此技能，AI 可以直接“看到”网页的真实呈现状态，并获取干净的结构化数据，而无需开发者手动编写繁琐的爬虫脚本。

使用以下命令快速安装：

npx skills add -g BenedictKing/firecrawl-scraper

安装完成后，请确保已配置 Firecrawl API 密钥，即可在 Claude Code 等 AI 终端对话中直接使用。

解压后将目录放入你的 AI 工具 skills 文件夹，重启工具后即可使用。具体路径参考内附的 USAGE.zh.md。

暂无推荐