首页 > 解决方案 > 您如何为 AWS 中的 lambda 遇到的错误百分比设置警报?

问题描述

我正在尝试添加一个 cloudwatch 警报,如果 lambda 经历的错误率超过某个百分比阈值,则会触发该警报。

我见过一些地方建议采用 lambda 错误计数和 lambda 调用计数并使用度量数学来执行error count / invocation count.

这种方法是有道理的,但是在上面进行手动计算和使用平均错误统计数据之间有什么区别?

标签: amazon-web-servicesaws-lambdaamazon-cloudwatchaws-serverless

解决方案


平均统计量是总和/样本计数。样本计数只是该时期内指标的 CloudWatch 数据点数。因此,它将是错误总数除以报告给 CloudWatch 的错误指标数。例如,如果您的跟踪时间超过 10 分钟,并且每分钟报告一次指标,那么 Average 将为您提供这 10 分钟内的平均错误数。这些都没有考虑到该期间的 Lambda 调用总数,只是考虑了错误的数量。

平均统计数据为您提供一段时间内的平均错误数。您需要一段时间内所有调用的平均错误数,因此您必须使用度量数学来考虑 2 个不同的度量(错误和调用)。


推荐阅读