alert - 如何使用普罗米修斯规则提醒 Pod 重新启动
问题描述
我喜欢使用 Prometheus 规则监控 Pod,这样当 Pod 重新启动时,我会收到警报。我想知道是否有人有示例 Prometheus 警报规则看起来像这样,但要重新启动
- alert: KubePodCrashLooping
annotations:
message: Pod {{ $labels.namespace }}/{{ $labels.pod }} ({{ $labels.container
}}) is restarting {{ printf "%.2f" $value }} times / 5 minutes.
expr: |
rate(kube_pod_container_status_restarts_total{job="kube-state-metrics"}[15m]) * 60 * 5 > 0
for: 1h
labels:
severity: critical
解决方案
推荐阅读
- c# - 将字符串解析为双精度时出现 System.FormatException
- java - Ant TaskDef 在 ClassLoader 中失败
- java - 我们可以将存储过程称为 webhook(只需触发并终止)
- java - Selenium 等待 ExpectedConditions.attributeToBe 的行为不符合预期
- sql - 在运行时确定 SQL From 子句?
- docker - 使用 Letsencrypt 的本地 Nginx 反向代理到 Docker 容器
- react-native - 网络请求在使用 fetch 反应本机时失败
- python - os.listdir() 列出数据文件但相应的断言失败
- c# - 使用 sonarqube 构建 csharp 项目时出现“IsTestFileByName 任务意外失败”错误
- node.js - 在 DialogFlow 中使用内联编辑器进行 http 请求调用