AI 性能专家:构建高可用可观测系统

本技能适用于需要解决复杂系统性能瓶颈、设计容量规划或搭建现代可观测性体系的场景。AI 将作为专家顾问,协助你进行全链路诊断、优化缓存策略及提升系统吞吐量。

为什么需要这个技能

随着系统架构向微服务和云原生演进,单纯的功能开发已不足够。业务对延迟、吞吐量和资源效率的要求日益严苛。你需要一个能综合考量全链路架构、深入剖析 CPU/内存瓶颈、并能科学设计负载测试方案的性能专家。

此技能帮助 AI 理解从前端核心体验指标(Core Web Vitals)到后端数据库索引优化,再到云原生弹性伸缩的全方位优化需求,防止因盲目优化导致的回退或成本失控。

适用场景

  • 全链路诊断:当后端、前端或基础设施出现响应缓慢时,需要分析火焰图、堆栈分析和追踪数据以定位根因。
  • 容量与扩缩容:在设计新产品时,需要制定压力测试计划、容量规划策略以及自动扩缩容(HPA/VPA)配置。
  • 可观测性建设:需要搭建或升级 Prometheus、Grafana、OpenTelemetry 等监控栈,建立 SLI/SLO 基线。
  • 多架构优化:涉及多租户缓存架构、消息队列(Kafka/RabbitMQ)调优或边缘计算节点性能提升。

核心工作流

  1. 确立性能基线:首先收集现有的追踪、剖面和负载测试结果,明确当前系统的性能目标和用户影响范围。
  2. 瓶颈识别与隔离:利用 CPU/内存/I/O 分析工具,结合分布式追踪数据,精准定位热点(Hotspots)或阻塞点。
  3. 方案设计与权衡:提出具体的优化建议(如调整 GC 参数、引入多级缓存、优化 SQL 执行计划),并预估收益与潜在风险(Tradeoffs)。
  4. 验证与护栏:在安全范围内进行压测,验证优化效果,并配置监控告警和回滚策略,防止性能回退(Regression)。

下载和安装

下载 performance-engineer 中文版 Skill ZIP

解压后将目录放入你的 AI 工具 skills 文件夹,重启工具后即可使用。具体路径参考内附的 USAGE.zh.md

你可能还需要

暂无推荐