google-cloud-platform - 在 Stackdriver 的错误报告中创建提醒政策
问题描述
我需要在有 30 个连接超时异常时创建警报策略。我们目前在 Web 服务调用期间出现连接超时时抛出异常(消耗安静的 Web 服务),所以我想在有 30 个连接超时时收到警报例外。有什么办法可以在 Stakdriver 中创建这样的策略。我们目前正在使用 java8、spring boot、google kubernetes 引擎、stackdriver 日志记录。我创建了名为 SAX-Exception 的指标,当我尝试为此指标创建堆栈驱动程序警报策略时,我看不到任何选项来聚合一段时间内的异常数量。
This below image shows how the metrics is defined
解决方案
对于这个答案,我假设您的连接错误已记录到 Stackdriver Logging 中,其中包含可供 Stackdriver 解析的足够详细信息。
如果您想使用 Stackdriver Alerting,抛出异常的软件需要使用 Stackdriver Logging 来记录。在几乎任何语言(包括 Java)中添加 Stackdriver 日志记录代码都非常简单。
假设您拥有包含所需事件详细信息的 Stackdriver Logging 日志:
- 转到 Stackdriver 日志记录。
- 根据您的日志条目中的内容,根据您想要的错误创建一个指标。
文档:链接。
创建指标后,您可以根据该指标创建警报。您可以根据每个时间段的事件数进行汇总。在您的情况下,一分钟内发生 30 个事件(或任何您需要作为失败指示器的事件)。
文档:链接。
推荐阅读
- python - 如何使用 python 或 Scala 将复杂的 SQL 查询转换为 spark-dataframe
- email - 从 HTTP 切换到 SSL 后私有域电子邮件被标记为垃圾邮件
- logging - 如何控制 podman 容器日志行为 (ctr.log)
- java - Java:布尔+整数
- flutter - 使用 IconData CodePoint 不显示颤振仪表图标
- python - 使用 MPI (SLURM) 运行 Python 代码比作为单个进程运行需要更长的时间
- javascript - React Hook - 只听窗口 *width* 大小变化
- c# - 如何转换为驻留在外部程序集中的具体类型
- php - 如何使用php跳过数据库中的表
- r - R中的Vlookup,在不匹配的地方保留一个空单元格