Skip to content

构建 AI Agent 的记忆系统:从短期上下文到长期向量存储

解决 AI Agent “健忘”的问题:通过构建多层级的记忆架构(短期、长期、工作记忆),让 Agent 能够跨会话记住用户偏好、历史经验和专业技能。

为什么需要这个技能

大多数 AI 交互在会话结束后就会丢失所有信息,这意味着每次新对话都必须从零开始。而真正的智能体(Agent)需要像人类一样拥有记忆。

记忆的核心不在于“存储”,而在于“检索”。存储一百万条事实如果没有高效的检索机制,对 Agent 来说毫无意义。通过合理的切片(Chunking)、嵌入(Embedding)和检索策略,可以让 Agent 在正确的时刻提取正确的记忆,实现个性化且连续的交互体验。

适用场景

  • 个性化助手:需要记住用户的姓名、偏好、职业等长期事实。
  • 复杂任务执行:需要回顾之前的操作步骤,避免重复错误(情景记忆)。
  • 技能习得:将特定的工作流或解决方案保存为模板,以便下次直接调用(程序性记忆)。
  • 海量知识库问答:基于 RAG 架构在数百万级文档中快速定位答案。

核心工作流

本技能采用 CoALA 认知架构框架,将记忆分为三类:

  1. 语义记忆 (Semantic Memory):存储客观事实和用户画像(如:用户喜欢深色模式)。
  2. 情景记忆 (Episodic Memory):存储带时间戳的经历(如:昨天帮用户调试了 Auth 模块)。
  3. 程序性记忆 (Procedural Memory):存储“如何做”的知识,通常表现为 Few-shot 示例。

关键技术实现路径:

  • 存储层选型:根据规模选择数据库。原型阶段使用 ChromaDB,中等规模使用 pgvectorQdrant,企业级海量数据选择 Pinecone
  • 切片策略:避免简单的固定长度切片,推荐使用 语义切片 (Semantic Chunking)结构感知切片(针对 Markdown 或代码),并在切片前添加文档摘要以增强上下文。
  • 检索优化
    • 元数据过滤:先通过 user_id 等元数据过滤,再进行向量相似度搜索,防止数据泄露且提高精度。
    • 混合搜索:结合语义搜索与关键词搜索(BM25),处理专业术语。
    • 重排序 (Reranking):使用 Cross-Encoder 对初筛结果进行精排。
  • 记忆衰减:实现基于时间或使用频率的衰减机制,自动清理过时或低价值的记忆,防止上下文窗口被冗余信息填满。

下载和安装

下载 agent-memory-systems 中文版 Skill ZIP

解压后将目录放入你的 AI 工具 skills 文件夹,重启工具后即可使用。具体路径参考内附的 USAGE.zh.md

你可能还需要

暂无推荐