首页 > 解决方案 > 在 grafana 中设置警报 | 百分位数与百分比

问题描述

我在 GCP VM 中使用 grafana 8。我正在监控许多也在 GCP 虚拟机中运行的服务的 CloudSQL 指标。我的要求是监控 1) 内存利用率 2) CPU 利用率和 3) 服务器正常运行时间,如果使用率超过 95%,则向相关人员发送警报。我没有为此使用 prometheus+cadvisor。我直接从 grafana 中的 GCP 插件监控它。

默认情况下,y 轴的单位是百分位数。如果我保留该单位,我应该提供多少数字才能在 95% 的情况下准确收到警报?此外,即使我将 y 轴单位从百分位更改为百分比并保存警报规则,即使使用率小于 1%,状态也会立即从 OK 变为待处理。我收到了很多不必要的警报。条件是这样的 - WHEN avg() OF query(A, 5min, now) 高于 95。CPU 利用率 服务器启动

我在这里做错了什么?如何正确设置条件?老实说,我什至不明白百分比和百分位数之间的区别。请帮忙。

非常感谢提前

标签: grafanagrafana-alerts

解决方案


推荐阅读