kubernetes - 在 Prometheus 仪表板上触发警报
问题描述
是否可以通过手动停止 Kubernetes 集群上的相应服务来触发 Prometheus 仪表板上的一些警报,以验证我是否收到 Prometheus 仪表板上的问题警报?
解决方案
您也可以使用 Gremlin 来实现此目标。首先,使用 helm chart 在 Kubernetes 集群上安装 Gremlin 代理:https ://github.com/gremlin/helm/
接下来,使用 Gremlin 中的 Kubernetes 功能关闭特定服务。您可以通过选择 1 个 pod/1 服务或多个 pod/服务来控制爆炸半径。这是我写的关于这个主题的教程:https ://www.gremlin.com/community/tutorials/how-to-install-and-use-gremlin-with-kubernetes/ 。
验证监控和警报是混沌工程的一个很好的用例。正如您所说,通过手动停止 Kubernetes 集群上的相应服务来触发 Prometheus 仪表板上的警报。这将使您能够验证 Prometheus 仪表板上的问题警报。本教程解释了如何将 Gremlin webhook 与 Grafana 和 Prometheus 一起使用:https ://www.gremlin.com/community/tutorials/visualize-chaos-experiments-in-grafana-with-gremlin-webhooks/
推荐阅读
- php - Laravel Ajax 数据中的数组到字符串
- python - 为什么我的代码运行这么慢?(嵌套 for 循环)
- sql - Joining/Querying Self-Referential "Grandchildren" Tables
- sql-server-express - 无法启动 SQL Server Express
- unity3d - Rendering orientation of an object with quaternion in Unity
- security - DTMF 音调是否由 DTMF 制作者解码?
- node.js - Dialogflow 正确处理一个 webhook 但拒绝另一个
- spring - 使用 CorsRegistry/@CrossOrigin 配置 Spring 后仍然出现 CORS 错误
- c++ - 将 OpenCV::Mat 作为 BLOB 存储到 SQLite DB
- r - 根据 r 中另一个变量元素值的值填充变量元素