如何开发 Apify Actor：从环境搭建到云端部署

本技能旨在帮助开发者快速上手 Apify Actor 的全生命周期开发，解决从本地环境配置、模板选择、逻辑实现到最终云端部署的完整流程问题。

为什么需要这个技能

Apify Actor 是一个基于 UNIX 哲学的 Serverless 程序，将特定的自动化任务（如网页抓取、数据处理）打包成 Docker 镜像并在云端运行。

传统的爬虫部署需要处理复杂的代理、并发控制和服务器维护。通过学习 Apify Actor 开发，你可以直接利用其内置的存储系统（Dataset, Key-Value Store）和强大的 SDK（如 Crawlee），将重心从底层基础设施转移到业务逻辑实现上。

首先确保安装了 apify-cli。建议使用包管理器安装以确保安全性：

npm install -g apify-cli

执行 apify login 进行身份验证，或在环境变量中配置 APIFY_TOKEN。

根据语言偏好选择模板创建项目：

实现逻辑：在 src/main.js (或 .ts, .py) 中编写核心代码。
定义模式：在 .actor/input_schema.json 中定义输入参数，在 output_schema.json 中定义输出结构。
本地运行：使用 apify run 启动。本地输入文件需放置在 storage/key_value_stores/default/INPUT.json。
注意：apify run 的结果仅保存在本地 storage/ 目录，不会同步到云端控制台。

使用以下命令将 Actor 推送到 Apify 云平台：

apify push

解压后将目录放入你的 AI 工具 skills 文件夹，重启工具后即可使用。具体路径参考内附的 USAGE.zh.md。

暂无推荐