如何构建基于沙箱环境的托管 AI Agent 基础设施

解决本地运行 AI Agent 的资源限制与环境不一致问题：通过在远程沙箱中托管 Agent 运行环境，实现秒级启动、无限并发以及跨平台的协作能力。

为什么需要这个技能

大多数 AI Agent 运行在本地机器上，这带来了三个核心痛点：资源竞争（占用大量内存/CPU）、环境不一致（每个开发者的配置不同）以及无法多人协作。

托管 Agent 将执行环境移至远程沙箱（如 Modal 或自定义 VM）。其核心目标是让用户感知到的延迟仅取决于模型的首字响应时间（TTFT），而所有基础设施的准备工作（克隆代码、安装依赖、构建项目）应在用户开始会话前就已完成。

适用场景

后台编码 Agent：需要独立于用户设备运行的自动化代码修复或研究工具。
沙箱执行环境：为 Agent 提供安全的隔离环境，防止其执行恶意代码影响主系统。
多端交互接口：同一个 Agent 实例需要同时支持 Slack、Web 界面和 Chrome 插件。
并行任务处理：一个主 Agent 根据需求自动创建多个子 Agent（Sub-agents）并行工作。

核心工作流

1. 环境预热与镜像管理

为了实现秒级启动，不能在用户请求时才执行 npm install。

镜像注册模式：每隔 30 分钟预构建一次环境镜像，包含已克隆的代码仓库、安装好的依赖以及初次构建的缓存。
预测性预热：当用户开始在输入框打字时，即刻启动沙箱预热，而非等待用户点击“发送”。
快照恢复：在镜像构建后和 Agent 完成修改后分别保存文件系统快照，实现状态的快速恢复。

2. Server-First 架构设计

将 Agent 逻辑定义为服务端，客户端（TUI, Web, Slack）仅作为薄壳。

状态隔离：每个会话使用独立的数据库（如 SQLite），确保会话间互不干扰。
实时同步：通过 WebSocket 实现 Token 流式输出、工具执行状态及文件变更的实时同步。
身份映射：在沙箱中通过 GitHub App Token 访问仓库，但在提交代码时，将 git config 的用户信息更新为实际触发请求的用户。

3. 自我衍生能力（Self-Spawning）

通过为 Agent 提供特定工具，使其能够自主创建新会话：

任务拆解：主 Agent 将复杂变更拆分为多个小 PR，并为每个 PR 启动一个独立的沙箱子会话。
并行研究：在多个不同仓库之间同时进行代码调研。

下载和安装

下载 hosted-agents 中文版 Skill ZIP

解压后将目录放入你的 AI 工具 skills 文件夹，重启工具后即可使用。具体路径参考内附的 USAGE.zh.md。

你可能还需要

暂无推荐