AI 性能专家:构建高可用可观测系统
本技能适用于需要解决复杂系统性能瓶颈、设计容量规划或搭建现代可观测性体系的场景。AI 将作为专家顾问,协助你进行全链路诊断、优化缓存策略及提升系统吞吐量。
为什么需要这个技能
随着系统架构向微服务和云原生演进,单纯的功能开发已不足够。业务对延迟、吞吐量和资源效率的要求日益严苛。你需要一个能综合考量全链路架构、深入剖析 CPU/内存瓶颈、并能科学设计负载测试方案的性能专家。
此技能帮助 AI 理解从前端核心体验指标(Core Web Vitals)到后端数据库索引优化,再到云原生弹性伸缩的全方位优化需求,防止因盲目优化导致的回退或成本失控。
适用场景
- 全链路诊断:当后端、前端或基础设施出现响应缓慢时,需要分析火焰图、堆栈分析和追踪数据以定位根因。
- 容量与扩缩容:在设计新产品时,需要制定压力测试计划、容量规划策略以及自动扩缩容(HPA/VPA)配置。
- 可观测性建设:需要搭建或升级 Prometheus、Grafana、OpenTelemetry 等监控栈,建立 SLI/SLO 基线。
- 多架构优化:涉及多租户缓存架构、消息队列(Kafka/RabbitMQ)调优或边缘计算节点性能提升。
核心工作流
- 确立性能基线:首先收集现有的追踪、剖面和负载测试结果,明确当前系统的性能目标和用户影响范围。
- 瓶颈识别与隔离:利用 CPU/内存/I/O 分析工具,结合分布式追踪数据,精准定位热点(Hotspots)或阻塞点。
- 方案设计与权衡:提出具体的优化建议(如调整 GC 参数、引入多级缓存、优化 SQL 执行计划),并预估收益与潜在风险(Tradeoffs)。
- 验证与护栏:在安全范围内进行压测,验证优化效果,并配置监控告警和回滚策略,防止性能回退(Regression)。
下载和安装
下载 performance-engineer 中文版 Skill ZIP
解压后将目录放入你的 AI 工具 skills 文件夹,重启工具后即可使用。具体路径参考内附的 USAGE.zh.md。
你可能还需要
暂无推荐