kubernetes - 如何在普罗米修斯操作员中获得有关配置重新加载错误的通知或警报?
问题描述
我使用 prometheus 运算符在 kubernetes 上部署监控堆栈。我想知道是否有办法知道配置重新加载器部署的配置是否失败。这对于使用配置重新加载器容器重新加载其配置的 prometheus 和警报管理器资源非常有用。当配置失败时。我们在容器中有一个日志,但是我们可以基于失败的配置重新加载获得通知或警报吗?
解决方案
Prometheus 公开了一个您可以抓取的 /metric 端点。特别是,有一个指标表明最后一次重新加载是否成功:
# HELP prometheus_config_last_reload_successful Whether the last configuration reload attempt was successful.
# TYPE prometheus_config_last_reload_successful gauge
prometheus_config_last_reload_successful 0
您可以使用它在重新加载失败时发出警报。
groups:
- name: PrometheusAlerts
rules:
- alert: FailedReload
expr: prometheus_config_last_reload_successful == 0
for: 5m
labels:
severity: warning
annotations:
description: Reloading Prometheus' configuration has failed for {{$labels.namespace}}/{{ $labels.pod}}.
summary: Prometheus configuration reload has failed
推荐阅读
- javascript - 无法连接到 localhost 5000
- java - Java - 处理文件中的数据
- c# - c#8 中 netstandard2.0 和 net451 的 AllowNull 属性引发编译错误
- javascript - vue.js 粘性导航栏仅执行一次并出现错误:scrollTop 始终为 0
- kubernetes - 具有 Kubernetes 的用户特定容器
- python - 如何将 Docker 容器的 IP 动态添加到 Django 的 ALLOWED_HOST
- javascript - 使用 vue.js 如何将图像制作为允许我路由另一个页面的按钮
- reference - Purebasic中冒号的作用是什么。此代码将采取哪些步骤?
- python - 如何用给定的索引索引numpy数组?
- c# - 数据绑定用户输入 C#