构建 LLM 应用的生产级设计模式指南

解决从 Demo 到生产环境的跨越问题：通过引入 RAG 优化、Agent 编排架构和 LLMOps 观测体系，将简单的 Prompt 交互提升为可维护、可扩展的商业级 AI 应用。

为什么需要这个技能

大多数 AI 应用在原型阶段只需一个简单的 Prompt 即可运行，但进入生产环境后会面临三大挑战：幻觉难以控制（需要 RAG）、复杂任务无法一次性完成（需要 Agent 架构）以及性能与成本不可见（需要 LLMOps）。

本技能提供了一套经过验证的模式矩阵，帮助开发者在不同场景下快速选择最合适的架构方案，避免在尝试错误路径上浪费开发资源。

不再仅仅依赖简单的向量搜索，而是采用混合检索（Hybrid Search）：将语义搜索与关键词搜索（BM25）结合，并通过 RRF 算法合并结果。同时，通过上下文压缩，仅将最相关的内容传递给 LLM，以降低 Token 成本并减少干扰。

根据任务复杂度选择模式：

在代码层接入 Trace 追踪（如 OpenTelemetry），监控关键指标：

解压后将目录放入你的 AI 工具 skills 文件夹，重启工具后即可使用。具体路径参考内附的 USAGE.zh.md。

暂无推荐