首页 > 解决方案 > 如何在 Kubernetes 中获得特定部署的停机时间?

问题描述

我有一个用例,我需要收集每个部署的停机时间(如果所有副本(pod)在同一时间点都停机)。

我的目标是保持每个部署自创建以来的总停机时间。

我尝试从部署状态中获取它,但问题是我需要经常调用以获取部署并检查是否有任何停机时间。

此外,部署状态仅存储最新更改。因此,如果有多个更改(即停机时间),我最终会错过每次通话之间发生的更改。此外,我最终会频繁地多次调用多个部署,这将消耗更多的计算资源。

是否有任何可靠的方法来收集部署的停机时间数据

提前致谢。

标签: kubernetesmonitoring

解决方案


像 prometheus 这样的监控工具将是处理此问题的更好解决方案。例如,下面是我们过去 2 天部署的图表

部署可用性

如果您查看不可用副本的蓝线,我们在大约 17:00 到 10:30 之间有一个副本不可用(理想情况下,不可用计数应该为零)

这似乎非常接近您正在寻找的内容。


推荐阅读