首页 > 解决方案 > Prometheus 实例在 AWS 上循环

问题描述

好的,有人已经解决了这个问题,所以我想我会在这里问。

我在 AWS Fargate 容器中运行 Prometheus 和 Grafana。为了实现跨升级收集的数据的持久性,我为 /var/lib/prometheus 使用了一个 EFS 文件系统(它只是一个 NFS 挂载点)。

当需要升级我的容器时,AWS 会启动第二个容器,等待运行状况检查通过,然后删除第一个容器。

问题是两个实例都指向同一个数据目录(NFS),并且那里有一个锁定文件。按照设计。

人们有解决方案吗?

我想过两个选择:

  1. 升级不同。在开始新的之前停止旧的。
  2. 更改容器中的启动脚本,等待旧锁消失,然后启动 Prometheus。我还会更新我的健康检查以对抗其他事情。

我不知道我是否可以保证锁定文件消失,但我怀疑 Prometheus 如果他启动并且它仍然存在,即使另一个容器已经消失,也会感到不安。

人们已经解决了这个问题,如果不是为了 Prometheus,那么对于其他将数据存储在卷中的服务器。建议?

标签: amazon-web-servicesprometheusaws-fargate

解决方案


推荐阅读