首页 > 解决方案 > 我应该将哪些指标用于警报 HTTPCode_Target_5XX_Count 或 HTTPCode_ELB_5XX_Count?

问题描述

我有一个带有单个目标组的 ALB(这是一个 istio-ingress 网关),我想捕获路由到该目标组的任何请求都返回 5XX 代码的场景。

根据文档:

HTTPCode_ELB_5XX_Count:

源自负载均衡器的 HTTP 5XX 服务器错误代码的数量。此计数不包括目标生成的任何响应代码。

HTTPCode_Target_5XX_Count:

目标生成的 HTTP 响应代码的数量。这不包括负载均衡器生成的任何响应代码。

我认为既然这是一个单一的目标群体,它们应该是相同的,但显然它们不是因为在特定时间范围内我看到了一些 HTTP 4XX 的数据,但没有看到 ELB 4XX 的数据。有什么不同?我应该使用哪一个?

标签: amazon-web-servicesaws-application-load-balancer

解决方案


@jellycsc 的图表在概念上是正确的。但是,根据:https ://docs.aws.amazon.com/elasticloadbalancing/latest/application/load-balancer-cloudwatch-metrics.html 。这些指标是相互排斥的。即 HTTPCode_ELB_4XX_Count 是来自负载均衡器的仅 4xx 响应代码的计数,而不是目标的计数,例如负载均衡器也不知道将请求转发到哪里。同样,HTTPCode_Target_4XX_Count 仅表示来自目标组的 4xx 响应的计数,而不是负载均衡器。


推荐阅读