构建 AI Agent 的记忆系统：从短期上下文到长期向量存储

解决 AI Agent “健忘”的问题：通过构建多层级的记忆架构（短期、长期、工作记忆），让 Agent 能够跨会话记住用户偏好、历史经验和专业技能。

为什么需要这个技能

大多数 AI 交互在会话结束后就会丢失所有信息，这意味着每次新对话都必须从零开始。而真正的智能体（Agent）需要像人类一样拥有记忆。

记忆的核心不在于“存储”，而在于“检索”。存储一百万条事实如果没有高效的检索机制，对 Agent 来说毫无意义。通过合理的切片（Chunking）、嵌入（Embedding）和检索策略，可以让 Agent 在正确的时刻提取正确的记忆，实现个性化且连续的交互体验。

本技能采用 CoALA 认知架构框架，将记忆分为三类：

存储层选型：根据规模选择数据库。原型阶段使用 ChromaDB，中等规模使用 pgvector 或 Qdrant，企业级海量数据选择 Pinecone。
切片策略：避免简单的固定长度切片，推荐使用 语义切片 (Semantic Chunking) 或 结构感知切片（针对 Markdown 或代码），并在切片前添加文档摘要以增强上下文。
检索优化：
- 元数据过滤：先通过 user_id 等元数据过滤，再进行向量相似度搜索，防止数据泄露且提高精度。
- 混合搜索：结合语义搜索与关键词搜索（BM25），处理专业术语。
- 重排序 (Reranking)：使用 Cross-Encoder 对初筛结果进行精排。
记忆衰减：实现基于时间或使用频率的衰减机制，自动清理过时或低价值的记忆，防止上下文窗口被冗余信息填满。

解压后将目录放入你的 AI 工具 skills 文件夹，重启工具后即可使用。具体路径参考内附的 USAGE.zh.md。

暂无推荐