一键生成 Prometheus 监控配置与告警规则

解决运维与开发团队的监控难题：通过 AI 自动生成完整的 Prometheus 部署脚本、指标采集配置、告警规则及长期存储方案，涵盖从入门到生产环境的最佳实践。

为什么需要这个技能

在现代云原生架构中，监控系统是保障服务稳定性的核心。然而，手动编写 prometheus.yml 配置、设计复杂的录制规则和告警逻辑，不仅耗时且容易出错。此外，如何选择合适的存储后端（如 Thanos 或 Cortex）以及正确配置 Kubernetes Service Discovery 也是许多开发者的痛点。本技能旨在通过标准化的流程，帮助团队快速落地可观测性方案，避免因配置不当导致的监控盲区。

适用场景

初始化新项目或微服务架构时，需要快速部署一套标准的监控体系。
需要将现有的应用指标接入 Prometheus，并自动配置 node_exporter 等采集器。
希望为 HTTP 请求、资源使用率等核心指标生成专业的告警规则。
需要规划长期数据存储方案，将短期数据迁移到对象存储或专用存储后端。
在 Kubernetes 环境中实现基于注解的自动服务发现配置。

核心工作流

确定部署方式：根据环境选择 Kubernetes Helm 图表或 Docker Compose 进行快速安装。
配置采集策略：定义全局采集间隔，配置静态目标、文件发现及 K8s Service Discovery。
设计录制规则：针对高频查询需求，预计算聚合指标（如 P95 延迟、错误率），减少实时计算压力。
制定告警策略：结合业务阈值，定义服务宕机、高错误率、资源耗尽等关键场景的告警。
验证与调优：使用 promtool 校验配置语法，模拟查询确保逻辑正确，并根据存储容量调整保留策略。

下载和安装

下载 prometheus-configuration 中文版 Skill ZIP

解压后将目录放入你的 AI 工具 skills 文件夹，重启工具后即可使用。具体路径参考内附的 USAGE.zh.md。

你可能还需要

暂无推荐

一键生成 Prometheus 监控配置与告警规则 #

为什么需要这个技能 #

适用场景 #

核心工作流 #