首页 > 解决方案 > AWS Cloudwatch 警报不会从警报状态返回 OK 状态,连续三个周期通知 SNS 主题

问题描述

我在自定义指标过滤器上为 lambda([ERRORS]) 创建了 ALARM。以下是指标过滤器和警报的配置。

logs.put_metric_filter(
        logGroupName='/aws/lambda/' + functionname,
        filterName=functionname +'_error_stage',
        filterPattern='"ERROR"',
        metricTransformations=[
            {
                'metricName': functionname +'_error_stage',
                'metricNamespace': 'lamda_error',
                'metricValue': '1',
                'defaultValue': 0
            },
        ]
    )

度量警报的配置。

cloudwatch.put_metric_alarm(
        ActionsEnabled=True,
        AlarmActions=[
            "arn:aws:sns:us-west-2:653453327677:logs_error_mail"
        ],
        AlarmName=alarm_name,
        ComparisonOperator= "GreaterThanOrEqualToThreshold",
        EvaluationPeriods=1,
        InsufficientDataActions=[],
        MetricName=function_name + '_error_stage',
        Namespace="lamda_error",
        OKActions=[],
        Period=300,
        Statistic="Sum",
        Threshold=1.0,
        TreatMissingData="missing"
    )

一切正常,但问题是每当触发警报时,它也会在接下来的 3 个连续时间段内触发。这是因为警报在五分钟后不会回到正常状态。如何更改配置使其不会被错误触发。

标签: amazon-web-servicesamazon-cloudwatch

解决方案


推荐阅读