Appearance
使用 AI 驱动的 Apify 自动化采集 50+ 主流平台数据
解决复杂网页数据采集的选型难题:通过 AI 自动匹配 55 个以上的 Apify Actor,将用户的模糊抓取需求转化为精准的工具调用,实现跨平台数据的快速提取与汇总。
为什么需要这个技能
在面对海量网页数据采集需求时,用户往往不清楚应该使用哪个具体的抓取工具(Actor),或者面对复杂的参数配置感到无从下手。
本技能将 AI 转化为一个“数据采集架构师”。它不仅内置了覆盖 Instagram、Facebook、TikTok、YouTube 和 Google Maps 等平台的 Actor 矩阵,还能根据你的具体目标(如:潜在客户开发、网红挖掘、品牌监测)自动推荐最佳工具,并指导 AI 完成从 Schema 获取到数据导出的全流程操作。
适用场景
- 潜在客户开发:从 Google Maps 提取企业信息,并联动联系方式抓取工具进行数据补全。
- 网红/竞品分析:快速获取 TikTok 或 Instagram 的个人资料、互动指标及粉丝增长数据。
- 趋势研究:监控 Google Trends 或各平台热搜标签(Hashtag)的实时内容。
- 口碑分析:批量导出 Booking.com 或 TripAdvisor 的酒店评论进行情感分析。
核心工作流
- 需求分析与 Actor 匹配:AI 根据用户目标,从内置矩阵中选择最合适的 Actor(如:
compass/crawler-google-places用于本地商家抓取)。 - 动态获取 Schema:使用
mcpc命令行工具实时获取该 Actor 的输入参数规范,确保配置准确。 - 确定导出偏好:AI 与用户确认输出格式(快速预览、CSV 全量导出或 JSON 格式)及结果数量。
- 执行采集脚本:运行
run_actor.js脚本,通过 API 触发 Apify 云端任务。 - 结果汇总与后续建议:AI 总结抓取结果,并建议下一步工作流(例如:抓取到商家列表后,建议执行联系信息补全)。
环境准备
在执行之前,请确保已完成以下配置:
- 准备
.env文件并填入APIFY_TOKEN=你的Token。 - 安装 Node.js 20.6+ 环境。
- 安装
mcpc命令行工具:bashnpm install -g @apify/mcpc
下载和安装
下载 apify-ultimate-scraper 中文版 Skill ZIP
解压后将目录放入你的 AI 工具 skills 文件夹,重启工具后即可使用。具体路径参考内附的 USAGE.zh.md。
你可能还需要
暂无推荐