首页 > 解决方案 > Prometheus 警报管理器 AWS 定义

问题描述

我正在尝试通过 AWS 工作区配置在我的 EKS 集群上运行的 Prometheus 警报管理器。现在,从我目前所读到的内容来看,这是更新配置的唯一方法,并且不可能通过 eksctl/helm 来完成。

现在你可以通过它做两件事:

  1. 规则管理 - 它要求您上传带有命名空间的 .yaml “命名空间包含定义记录和警报规则的规则组。” - 这里是规则 yaml 文件,我对他们给出的基本解释还算满意,但不是那么多,我希望有更多:https ://docs.aws.amazon.com/prometheus/latest/userguide /AMP-标尺-rulesfile.html

  2. 警报管理器 - “添加警报管理器定义以开始路由、禁止和静音警报。” 几乎不言自明,(重要的是:我使用 slack 作为接收器,但是我这样做没有像AWS 要求的那样配置 SNS 和 Lambda!)。现在,当我开始上传 .yaml 到那里时,我得到“格式错误的 Alertmanager 定义”。这是一个经过验证的有效 yaml 文件!

配置如下:

alertmanager_config: |
  route:
    group_by: ['alertname']
    group_wait: 10s
    group_interval: 10s
    repeat_interval: 1m
    receiver: 'slack_notifications'
  receivers:
    - name: 'slack_notifications'
      slack_configs:
    - api_url: 'https://hooks.slack.com/services/ooga/booga/key'
        channel: '#slack-monitoring'
        send_resolved: true
  inhibit_rules:
    - source_match:
        severity: 'critical'
      target_match:
        severity: 'warning'
      equal: ['alertname', 'dev', 'instasnce'] 

我已经尝试了上述的不同变体,但没有一个奏效......

到目前为止,有没有人处理过这个问题并通过 AWS Workspaces 成功配置了 Prometheus?互联网上没有任何关于它的信息,我知道这是 AWS 发布的一项相当新的服务,但几乎没有社区支持 :(

干杯,弗拉特科

标签: amazon-web-servicesprometheusmonitoringprometheus-alertmanager

解决方案


Amazon Managed Service for Prometheus 目前支持的唯一警报接收器是 Amazon Simple Notification Service (Amazon SNS)

这里

此外,由于 sns_configs 中不支持的属性和必需的块,文档很有用。


推荐阅读