Pi 集成架构

本文介绍 OpenClaw 如何集成 pi-coding-agent 及其兄弟包（pi-ai、pi-agent-core、pi-tui）来驱动其 AI Agent 能力。

概述

OpenClaw 使用 pi SDK 将 AI 编码 Agent 嵌入其消息网关架构。它不以子进程或 RPC 模式运行 pi，而是直接导入并通过 createAgentSession() 实例化 pi 的 AgentSession。这种嵌入式方式提供了：

对会话生命周期和事件处理的完全控制
自定义工具注入（消息、沙箱、频道特定操作）
按频道/上下文自定义系统提示
支持分支/压缩的会话持久化
带故障转移的多账号认证轮换
与 Provider 无关的模型切换

包依赖

json

{
  "@mariozechner/pi-agent-core": "0.61.1",
  "@mariozechner/pi-ai": "0.61.1",
  "@mariozechner/pi-coding-agent": "0.61.1",
  "@mariozechner/pi-tui": "0.61.1"
}

包	用途
`pi-ai`	核心 LLM 抽象：`Model`、`streamSimple`、消息类型、Provider API
`pi-agent-core`	Agent 循环、工具执行、`AgentMessage` 类型
`pi-coding-agent`	高级 SDK：`createAgentSession`、`SessionManager`、`AuthStorage`、`ModelRegistry`、内置工具
`pi-tui`	终端 UI 组件（用于 OpenClaw 的本地 TUI 模式）

文件结构

src/agents/
├── pi-embedded-runner.ts          # 从 pi-embedded-runner/ 重导出
├── pi-embedded-runner/
│   ├── run.ts                     # 主入口：runEmbeddedPiAgent()
│   ├── run/
│   │   ├── attempt.ts             # 单次尝试逻辑，含会话设置
│   │   ├── params.ts              # RunEmbeddedPiAgentParams 类型
│   │   ├── payloads.ts            # 从运行结果构建响应载荷
│   │   ├── images.ts              # 视觉模型图片注入
│   │   └── types.ts               # EmbeddedRunAttemptResult
│   ├── abort.ts                   # 中止错误检测
│   ├── cache-ttl.ts               # 上下文裁剪的缓存 TTL 追踪
│   ├── compact.ts                 # 手动/自动压缩逻辑
│   ├── extensions.ts              # 嵌入式运行的 pi 扩展加载
│   ├── extra-params.ts            # Provider 特定流参数
│   ├── google.ts                  # Google/Gemini turn 顺序修复
│   ├── history.ts                 # 历史限制（DM 与群组）
│   ├── lanes.ts                   # 会话/全局命令通道
│   ├── logger.ts                  # 子系统日志
│   ├── model.ts                   # 通过 ModelRegistry 解析模型
│   ├── runs.ts                    # 活跃运行追踪、中止、队列
│   ├── sandbox-info.ts            # 系统提示的沙箱信息
│   ├── session-manager-cache.ts   # SessionManager 实例缓存
│   ├── session-manager-init.ts    # 会话文件初始化
│   ├── system-prompt.ts           # 系统提示构建器
│   ├── tool-split.ts              # 将工具分为 builtIn vs custom
│   ├── types.ts                   # EmbeddedPiAgentMeta, EmbeddedPiRunResult
│   └── utils.ts                   # ThinkLevel 映射、错误描述
├── pi-embedded-subscribe.ts       # 会话事件订阅/分发
├── pi-embedded-subscribe.types.ts # SubscribeEmbeddedPiSessionParams
├── pi-embedded-subscribe.handlers.ts # 事件处理器工厂
├── pi-embedded-subscribe.handlers.lifecycle.ts
├── pi-embedded-subscribe.handlers.types.ts
├── pi-embedded-block-chunker.ts   # 流式块回复分片
├── pi-embedded-messaging.ts       # 消息工具发送追踪
├── pi-embedded-helpers.ts         # 错误分类、turn 验证
├── pi-embedded-helpers/           # 辅助模块
├── pi-embedded-utils.ts           # 格式化工具
├── pi-tools.ts                    # createOpenClawCodingTools()
├── pi-tools.abort.ts              # AbortSignal 包装工具
├── pi-tools.policy.ts             # 工具允许/拒绝列表策略
├── pi-tools.read.ts               # Read 工具自定义
├── pi-tools.schema.ts             # 工具 schema 规范化
├── pi-tools.types.ts              # AnyAgentTool 类型别名
├── pi-tool-definition-adapter.ts  # AgentTool -> ToolDefinition 适配器
├── pi-settings.ts                 # 设置覆盖
├── pi-extensions/                 # 自定义 pi 扩展
│   ├── compaction-safeguard.ts    # 压缩安全保障扩展
│   ├── compaction-safeguard-runtime.ts
│   ├── context-pruning.ts         # 缓存 TTL 上下文裁剪扩展
│   └── context-pruning/
├── model-auth.ts                  # 认证档案解析
├── auth-profiles.ts               # 档案存储、冷却、故障转移
├── model-selection.ts             # 默认模型解析
├── models-config.ts               # models.json 生成
├── model-catalog.ts               # 模型目录缓存
├── context-window-guard.ts        # 上下文窗口验证
├── failover-error.ts              # FailoverError 类
├── defaults.ts                    # DEFAULT_PROVIDER, DEFAULT_MODEL
├── system-prompt.ts               # buildAgentSystemPrompt()
├── system-prompt-params.ts        # 系统提示参数解析
├── system-prompt-report.ts        # 调试报告生成
├── tool-summaries.ts              # 工具描述摘要
├── tool-policy.ts                 # 工具策略解析
├── transcript-policy.ts           # 转录验证策略
├── skills.ts                      # Skill 快照/提示构建
├── skills/                        # Skill 子系统
├── sandbox.ts                     # 沙箱上下文解析
├── sandbox/                       # 沙箱子系统
├── channel-tools.ts               # 频道特定工具注入
├── openclaw-tools.ts              # OpenClaw 特定工具
├── bash-tools.ts                  # exec/process 工具
├── apply-patch.ts                 # apply_patch 工具（OpenAI）
├── tools/                         # 独立工具实现
│   ├── browser-tool.ts
│   ├── canvas-tool.ts
│   ├── cron-tool.ts
│   ├── gateway-tool.ts
│   ├── image-tool.ts
│   ├── message-tool.ts
│   ├── nodes-tool.ts
│   ├── session*.ts
│   ├── web-*.ts
│   └── ...
└── ...

频道特定消息动作运行时现已迁移到插件自有扩展目录，例如：

extensions/discord/src/actions/runtime*.ts
extensions/slack/src/action-runtime.ts
extensions/telegram/src/action-runtime.ts
extensions/whatsapp/src/action-runtime.ts

核心集成流程

1. 运行嵌入式 Agent

主入口为 pi-embedded-runner/run.ts 中的 runEmbeddedPiAgent()：

typescript

import { runEmbeddedPiAgent } from "./agents/pi-embedded-runner.js";

const result = await runEmbeddedPiAgent({
  sessionId: "user-123",
  sessionKey: "main:whatsapp:+1234567890",
  sessionFile: "/path/to/session.jsonl",
  workspaceDir: "/path/to/workspace",
  config: openclawConfig,
  prompt: "Hello, how are you?",
  provider: "anthropic",
  model: "claude-sonnet-4-20250514",
  timeoutMs: 120_000,
  runId: "run-abc",
  onBlockReply: async (payload) => {
    await sendToChannel(payload.text, payload.mediaUrls);
  },
});

2. 会话创建

在 runEmbeddedAttempt()（由 runEmbeddedPiAgent() 调用）内部，使用 pi SDK：

typescript

import {
  createAgentSession,
  DefaultResourceLoader,
  SessionManager,
  SettingsManager,
} from "@mariozechner/pi-coding-agent";

const resourceLoader = new DefaultResourceLoader({
  cwd: resolvedWorkspace,
  agentDir,
  settingsManager,
  additionalExtensionPaths,
});
await resourceLoader.reload();

const { session } = await createAgentSession({
  cwd: resolvedWorkspace,
  agentDir,
  authStorage: params.authStorage,
  modelRegistry: params.modelRegistry,
  model: params.model,
  thinkingLevel: mapThinkingLevel(params.thinkLevel),
  tools: builtInTools,
  customTools: allCustomTools,
  sessionManager,
  settingsManager,
  resourceLoader,
});

applySystemPromptOverrideToSession(session, systemPromptOverride);

3. 事件订阅

subscribeEmbeddedPiSession() 订阅 pi 的 AgentSession 事件：

typescript

const subscription = subscribeEmbeddedPiSession({
  session: activeSession,
  runId: params.runId,
  verboseLevel: params.verboseLevel,
  reasoningMode: params.reasoningLevel,
  toolResultFormat: params.toolResultFormat,
  onToolResult: params.onToolResult,
  onReasoningStream: params.onReasoningStream,
  onBlockReply: params.onBlockReply,
  onPartialReply: params.onPartialReply,
  onAgentEvent: params.onAgentEvent,
});

处理的事件包括：

message_start / message_end / message_update（流式文本/思考）
tool_execution_start / tool_execution_update / tool_execution_end
turn_start / turn_end
agent_start / agent_end
auto_compaction_start / auto_compaction_end

4. 提示

设置完成后，对会话发起提示：

typescript

await session.prompt(effectivePrompt, { images: imageResult.images });

SDK 处理完整的 Agent 循环：发送给 LLM、执行工具调用、流式响应。

图片注入是提示局部的：OpenClaw 从当前提示中加载图片引用，并通过 images 在该 turn 传递，不会重新扫描旧的历史 turn 以重新注入图片载荷。

工具架构

工具流水线

基础工具：pi 的 codingTools（read、bash、edit、write）
自定义替换：OpenClaw 用 exec/process 替换 bash，针对沙箱自定义 read/edit/write
OpenClaw 工具：消息、浏览器、canvas、会话、cron、gateway 等
频道工具：Discord/Telegram/Slack/WhatsApp 特定动作工具
策略过滤：按档案、provider、agent、群组、沙箱策略过滤工具
Schema 规范化：清理 Gemini/OpenAI 的 schema 兼容性问题
AbortSignal 包装：工具包装以遵守中止信号

工具定义适配器

pi-agent-core 的 AgentTool 与 pi-coding-agent 的 ToolDefinition 的 execute 签名不同。pi-tool-definition-adapter.ts 中的适配器负责桥接：

typescript

export function toToolDefinitions(tools: AnyAgentTool[]): ToolDefinition[] {
  return tools.map((tool) => ({
    name: tool.name,
    label: tool.label ?? name,
    description: tool.description ?? "",
    parameters: tool.parameters,
    execute: async (toolCallId, params, onUpdate, _ctx, signal) => {
      // pi-coding-agent 签名与 pi-agent-core 不同
      return await tool.execute(toolCallId, params, signal, onUpdate);
    },
  }));
}

工具分割策略

splitSdkTools() 通过 customTools 传递所有工具：

typescript

export function splitSdkTools(options: { tools: AnyAgentTool[]; sandboxEnabled: boolean }) {
  return {
    builtInTools: [], // 为空，我们覆盖所有工具
    customTools: toToolDefinitions(options.tools),
  };
}

这确保 OpenClaw 的策略过滤、沙箱集成和扩展工具集在各 provider 之间保持一致。

系统提示构建

系统提示由 buildAgentSystemPrompt()（system-prompt.ts）构建，包含工具说明、工具调用风格、安全规则、OpenClaw CLI 参考、Skills、文档、工作空间、沙箱、消息、回复标签、语音、静默回复、心跳、运行时元数据，以及启用时的记忆和反应，还有可选的上下文文件和额外系统提示内容。子 Agent 使用的最小提示模式会裁剪各节。

提示在会话创建后通过 applySystemPromptOverrideToSession() 应用：

typescript

const systemPromptOverride = createSystemPromptOverride(appendPrompt);
applySystemPromptOverrideToSession(session, systemPromptOverride);

会话管理

会话文件

会话是带树形结构的 JSONL 文件（通过 id/parentId 链接）。Pi 的 SessionManager 负责持久化：

typescript

const sessionManager = SessionManager.open(params.sessionFile);

OpenClaw 用 guardSessionManager() 包装以保证工具结果安全。

会话缓存

session-manager-cache.ts 缓存 SessionManager 实例以避免重复解析文件：

typescript

await prewarmSessionFile(params.sessionFile);
sessionManager = SessionManager.open(params.sessionFile);
trackSessionManagerAccess(params.sessionFile);

历史限制

limitHistoryTurns() 根据频道类型（DM 与群组）裁剪对话历史。

压缩

上下文溢出时触发自动压缩。compactEmbeddedPiSessionDirect() 处理手动压缩：

typescript

const compactResult = await compactEmbeddedPiSessionDirect({
  sessionId, sessionFile, provider, model, ...
});

认证与模型解析

认证档案

OpenClaw 维护一个每 provider 多 API Key 的认证档案存储：

typescript

const authStore = ensureAuthProfileStore(agentDir, { allowKeychainPrompt: false });
const profileOrder = resolveAuthProfileOrder({ cfg, store: authStore, provider, preferredProfile });

档案在失败时轮换，带冷却追踪：

typescript

await markAuthProfileFailure({ store, profileId, reason, cfg, agentDir });
const rotated = await advanceAuthProfile();

模型解析

typescript

import { resolveModel } from "./pi-embedded-runner/model.js";

const { model, error, authStorage, modelRegistry } = resolveModel(
  provider,
  modelId,
  agentDir,
  config,
);

// 使用 pi 的 ModelRegistry 和 AuthStorage
authStorage.setRuntimeApiKey(model.provider, apiKeyInfo.apiKey);

故障转移

FailoverError 在配置了回退时触发模型切换：

typescript

if (fallbackConfigured && isFailoverErrorMessage(errorText)) {
  throw new FailoverError(errorText, {
    reason: promptFailoverReason ?? "unknown",
    provider,
    model: modelId,
    profileId,
    status: resolveFailoverStatus(promptFailoverReason),
  });
}

Pi 扩展

OpenClaw 加载自定义 pi 扩展以实现专项行为：

压缩安全保障

src/agents/pi-extensions/compaction-safeguard.ts 为压缩添加护栏，包括自适应 token 预算以及工具失败和文件操作摘要：

typescript

if (resolveCompactionMode(params.cfg) === "safeguard") {
  setCompactionSafeguardRuntime(params.sessionManager, { maxHistoryShare });
  paths.push(resolvePiExtensionPath("compaction-safeguard"));
}

上下文裁剪

src/agents/pi-extensions/context-pruning.ts 实现基于缓存 TTL 的上下文裁剪：

typescript

if (cfg?.agents?.defaults?.contextPruning?.mode === "cache-ttl") {
  setContextPruningRuntime(params.sessionManager, {
    settings,
    contextWindowTokens,
    isToolPrunable,
    lastCacheTouchAt,
  });
  paths.push(resolvePiExtensionPath("context-pruning"));
}

流式传输与块回复

块分片

EmbeddedBlockChunker 将流式文本管理为离散的回复块：

typescript

const blockChunker = blockChunking ? new EmbeddedBlockChunker(blockChunking) : null;

思考/最终标签剥除

流式输出经过处理以剥除 <think>/<thinking> 块并提取 <final> 内容：

typescript

const stripBlockTags = (text: string, state: { thinking: boolean; final: boolean }) => {
  // 剥除 <think>...</think> 内容
  // 若 enforceFinalTag，仅返回 <final>...</final> 内容
};

回复指令

[[media:url]]、[[voice]]、[[reply:id]] 等回复指令被解析并提取：

typescript

const { text: cleanedText, mediaUrls, audioAsVoice, replyToId } = consumeReplyDirectives(chunk);

错误处理

错误分类

pi-embedded-helpers.ts 对错误进行分类以便适当处理：

typescript

isContextOverflowError(errorText)     // 上下文过大
isCompactionFailureError(errorText)   // 压缩失败
isAuthAssistantError(lastAssistant)   // 认证失败
isRateLimitAssistantError(...)        // 触发限速
isFailoverAssistantError(...)         // 应进行故障转移
classifyFailoverReason(errorText)     // "auth" | "rate_limit" | "quota" | "timeout" | ...

思考级别回退

若思考级别不受支持，则回退：

typescript

const fallbackThinking = pickFallbackThinkingLevel({
  message: errorText,
  attempted: attemptedThinking,
});
if (fallbackThinking) {
  thinkLevel = fallbackThinking;
  continue;
}

沙箱集成

启用沙箱模式时，工具和路径受到约束：

typescript

const sandbox = await resolveSandboxContext({
  config: params.config,
  sessionKey: sandboxSessionKey,
  workspaceDir: resolvedWorkspace,
});

if (sandboxRoot) {
  // 使用沙箱化的 read/edit/write 工具
  // Exec 在容器内运行
  // 浏览器使用桥接 URL
}

Provider 特定处理

Anthropic

拒绝魔法字符串清理
连续角色的 turn 验证
Claude Code 参数兼容性

Google/Gemini

Turn 顺序修复（applyGoogleTurnOrderingFix）
工具 schema 清理（sanitizeToolsForGoogle）
会话历史清理（sanitizeSessionHistory）

OpenAI

Codex 模型的 apply_patch 工具
思考级别降级处理

TUI 集成

OpenClaw 也有本地 TUI 模式，直接使用 pi-tui 组件：

typescript

// src/tui/tui.ts
import { ... } from "@mariozechner/pi-tui";

这提供了与 pi 原生模式相似的交互式终端体验。

与 Pi CLI 的主要差异

方面	Pi CLI	OpenClaw 嵌入式
调用方式	`pi` 命令 / RPC	通过 `createAgentSession()` 使用 SDK
工具	默认编码工具	自定义 OpenClaw 工具套件
系统提示	AGENTS.md + prompts	按频道/上下文动态生成
会话存储	`~/.pi/agent/sessions/`	`~/.openclaw/agents/<agentId>/sessions/`（或 `$OPENCLAW_STATE_DIR/agents/<agentId>/sessions/`）
认证	单一凭证	多档案轮换
扩展	从磁盘加载	编程式 + 磁盘路径
事件处理	TUI 渲染	回调式（onBlockReply 等）

未来展望

可能需要重构的方向：

工具签名对齐：目前在 pi-agent-core 和 pi-coding-agent 签名之间做适配
SessionManager 包装：guardSessionManager 增加了安全性但也增加了复杂度
扩展加载：可以更直接地使用 pi 的 ResourceLoader
流式处理复杂度：subscribeEmbeddedPiSession 已变得相当庞大
Provider 特殊处理：大量 provider 特定代码路径，pi 未来可能会处理

测试

Pi 集成测试覆盖以下套件：

src/agents/pi-*.test.ts
src/agents/pi-auth-json.test.ts
src/agents/pi-embedded-*.test.ts
src/agents/pi-embedded-helpers*.test.ts
src/agents/pi-embedded-runner*.test.ts
src/agents/pi-embedded-runner/**/*.test.ts
src/agents/pi-embedded-subscribe*.test.ts
src/agents/pi-tools*.test.ts
src/agents/pi-tool-definition-adapter*.test.ts
src/agents/pi-settings.test.ts
src/agents/pi-extensions/**/*.test.ts

实时/可选：

src/agents/pi-embedded-runner-extraparams.live.test.ts（启用 OPENCLAW_LIVE_TEST=1）

运行命令见 Pi 开发工作流。

Pi 集成架构 ​

概述 ​

包依赖 ​

文件结构 ​

核心集成流程 ​

1. 运行嵌入式 Agent ​

2. 会话创建 ​

3. 事件订阅 ​

4. 提示 ​

工具架构 ​

工具流水线 ​

工具定义适配器 ​

工具分割策略 ​

系统提示构建 ​

会话管理 ​

会话文件 ​

会话缓存 ​

历史限制 ​

压缩 ​

认证与模型解析 ​

认证档案 ​

模型解析 ​

故障转移 ​

Pi 扩展 ​

压缩安全保障 ​

上下文裁剪 ​

流式传输与块回复 ​

块分片 ​

思考/最终标签剥除 ​

回复指令 ​

错误处理 ​

错误分类 ​

思考级别回退 ​

沙箱集成 ​

Provider 特定处理 ​

Anthropic ​

Google/Gemini ​

OpenAI ​

TUI 集成 ​

与 Pi CLI 的主要差异 ​

未来展望 ​

测试 ​

Pi 集成架构

概述

包依赖

文件结构

核心集成流程

1. 运行嵌入式 Agent

2. 会话创建

3. 事件订阅

4. 提示

工具架构

工具流水线

工具定义适配器

工具分割策略

系统提示构建

会话管理

会话文件

会话缓存

历史限制

压缩

认证与模型解析

认证档案

模型解析

故障转移

Pi 扩展

压缩安全保障

上下文裁剪

流式传输与块回复

块分片

思考/最终标签剥除

回复指令

错误处理

错误分类

思考级别回退

沙箱集成

Provider 特定处理

Anthropic

Google/Gemini

OpenAI

TUI 集成

与 Pi CLI 的主要差异

未来展望

测试