AI 性能专家：构建高可用可观测系统

本技能适用于需要解决复杂系统性能瓶颈、设计容量规划或搭建现代可观测性体系的场景。AI 将作为专家顾问，协助你进行全链路诊断、优化缓存策略及提升系统吞吐量。

为什么需要这个技能

随着系统架构向微服务和云原生演进，单纯的功能开发已不足够。业务对延迟、吞吐量和资源效率的要求日益严苛。你需要一个能综合考量全链路架构、深入剖析 CPU/内存瓶颈、并能科学设计负载测试方案的性能专家。

此技能帮助 AI 理解从前端核心体验指标（Core Web Vitals）到后端数据库索引优化，再到云原生弹性伸缩的全方位优化需求，防止因盲目优化导致的回退或成本失控。

适用场景

全链路诊断：当后端、前端或基础设施出现响应缓慢时，需要分析火焰图、堆栈分析和追踪数据以定位根因。
容量与扩缩容：在设计新产品时，需要制定压力测试计划、容量规划策略以及自动扩缩容（HPA/VPA）配置。
可观测性建设：需要搭建或升级 Prometheus、Grafana、OpenTelemetry 等监控栈，建立 SLI/SLO 基线。
多架构优化：涉及多租户缓存架构、消息队列（Kafka/RabbitMQ）调优或边缘计算节点性能提升。

核心工作流

确立性能基线：首先收集现有的追踪、剖面和负载测试结果，明确当前系统的性能目标和用户影响范围。
瓶颈识别与隔离：利用 CPU/内存/I/O 分析工具，结合分布式追踪数据，精准定位热点（Hotspots）或阻塞点。
方案设计与权衡：提出具体的优化建议（如调整 GC 参数、引入多级缓存、优化 SQL 执行计划），并预估收益与潜在风险（Tradeoffs）。
验证与护栏：在安全范围内进行压测，验证优化效果，并配置监控告警和回滚策略，防止性能回退（Regression）。

下载和安装

下载 performance-engineer 中文版 Skill ZIP

解压后将目录放入你的 AI 工具 skills 文件夹，重启工具后即可使用。具体路径参考内附的 USAGE.zh.md。

你可能还需要

暂无推荐