首页 > 解决方案 > 备份和恢复 prometheus 指标

问题描述

所以,我的情况是我正在部署一个产品,我正在使用 prometheus/grafana 作为指标。可能会发生奇怪的事情,我想获得用于调查的指标。我想指导客户支持团队如何获取它们并将它们交给调查,但我无法让它发挥作用。

因此,按照这些页面:

我在服务器上生成了快照,它保存在一个名为XXXXX-XXXX/XXXXX. 我在本地复制了这个文件。

没有商品,我创建了一个像这样的 docker compose:

version: '3.8'
services:
  prometheus:
    image: prom/prometheus:v2.16.0
    restart: always
    volumes:
      - ./prometheus.yml:/etc/prometheus/prometheus.yml
      - ./prometheus/data:/data:rw
    command:
      - '--storage.tsdb.path=/data'
      - '--web.enable-admin-api'
      - '--config.file=/etc/prometheus/prometheus.yml'
    port:
      - 9090:9090

配置文件 - 没什么特别的,但它是:

global:
  scrape_interval: 15s
  evaluation_interval: 15s
rule_files:
  # comment
scrape_configs:
  - job_name: prometheus
    static_configs:
      - targets: ['localhost:9090']
  - job_name: app
    scrape_interval: 5s
    static_configs:
      - targets: ['phony-host:port']

这是一个虚拟配置,那些主机甚至不存在,只是其中的一些东西。

现在,在我复制./prometheus/data目录中的快照文件并启动 docker(通过docker-compose)后,我看不到任何我希望在快照中具有的指标。难道我做错了什么?配置中是否缺少某些内容?需要明确的是,我不是在复制XXX-XXX/XXXX目录,我只是复制文件。

此外,还有一些其他评论:

标签: prometheusrestoresnapshot

解决方案


解决了。我的错误——这是真的,文档也不是 100% 清楚的。

所以,我将快照存储在一个像{DATA}\{XXXX-XXXX}\{YYYY}. 我的错误是我正在复制目录的内容{XXXX-XXXX}\{YYYY}。我应该复制目录的内容{XXXX-XXXX}。做到了,它的工作原理。

另外值得注意的是,这些指标可能需要一段时间才能可见。


推荐阅读