如何构建基于沙箱环境的托管 AI Agent 基础设施

解决本地运行 AI Agent 的资源限制与环境不一致问题:通过在远程沙箱中托管 Agent 运行环境,实现秒级启动、无限并发以及跨平台的协作能力。

为什么需要这个技能

大多数 AI Agent 运行在本地机器上,这带来了三个核心痛点:资源竞争(占用大量内存/CPU)、环境不一致(每个开发者的配置不同)以及无法多人协作。

托管 Agent 将执行环境移至远程沙箱(如 Modal 或自定义 VM)。其核心目标是让用户感知到的延迟仅取决于模型的首字响应时间(TTFT),而所有基础设施的准备工作(克隆代码、安装依赖、构建项目)应在用户开始会话前就已完成。

适用场景

  • 后台编码 Agent:需要独立于用户设备运行的自动化代码修复或研究工具。
  • 沙箱执行环境:为 Agent 提供安全的隔离环境,防止其执行恶意代码影响主系统。
  • 多端交互接口:同一个 Agent 实例需要同时支持 Slack、Web 界面和 Chrome 插件。
  • 并行任务处理:一个主 Agent 根据需求自动创建多个子 Agent(Sub-agents)并行工作。

核心工作流

1. 环境预热与镜像管理

为了实现秒级启动,不能在用户请求时才执行 npm install

  • 镜像注册模式:每隔 30 分钟预构建一次环境镜像,包含已克隆的代码仓库、安装好的依赖以及初次构建的缓存。
  • 预测性预热:当用户开始在输入框打字时,即刻启动沙箱预热,而非等待用户点击“发送”。
  • 快照恢复:在镜像构建后和 Agent 完成修改后分别保存文件系统快照,实现状态的快速恢复。

2. Server-First 架构设计

将 Agent 逻辑定义为服务端,客户端(TUI, Web, Slack)仅作为薄壳。

  • 状态隔离:每个会话使用独立的数据库(如 SQLite),确保会话间互不干扰。
  • 实时同步:通过 WebSocket 实现 Token 流式输出、工具执行状态及文件变更的实时同步。
  • 身份映射:在沙箱中通过 GitHub App Token 访问仓库,但在提交代码时,将 git config 的用户信息更新为实际触发请求的用户。

3. 自我衍生能力(Self-Spawning)

通过为 Agent 提供特定工具,使其能够自主创建新会话:

  • 任务拆解:主 Agent 将复杂变更拆分为多个小 PR,并为每个 PR 启动一个独立的沙箱子会话。
  • 并行研究:在多个不同仓库之间同时进行代码调研。

下载和安装

下载 hosted-agents 中文版 Skill ZIP

解压后将目录放入你的 AI 工具 skills 文件夹,重启工具后即可使用。具体路径参考内附的 USAGE.zh.md

你可能还需要

暂无推荐