monitoring - 如何计算 24 小时内发送到 Datadog 的指标数量?
问题描述
我有一种情况,我试图计算加载到我正在监视的系统中的文件数量。每次加载文件时,我都会向 Datadog 发送“加载时间”指标,并且只要没有出现预期的文件,我就需要发送警报。为此,我将计算 24 小时内发送到 Datadog 的“加载时间”指标的数量,然后使用异常检测来查看它是否小于预期的正常数量。但是,我很难找到一种方法来持续提取此计数以用于警报。
我不能使用 count_nonzero 函数,因为我的一些文件是空的并且加载时间为 0。我知道 .as_count() 和 count:metric{tags},但我还没有找到包含的方法与其中任何一个的评估间隔。我尝试使用 .rollup(count, time) 来计算发送的指标,但这个调用似乎会根据汇总间隔返回可变结果。例如,如果我比较 2000 秒和 4000 秒的时间间隔,我希望每个 4000 秒的时间间隔在同一时间段内计算大约两个 2000 秒的时间间隔的总和。这似乎根本不是发生的事情 - 较小间隔的计数加起来似乎比较大间隔的计数要多得多。此外,一些汇总间隔将十进制数字显示为计数,
有没有人对如何做到这一点有任何想法?我真的很感激任何新的想法。
解决方案
推荐阅读
- elasticsearch - 一旦从 FluentD 插入到 Elastic 搜索索引中,有效负载开始和结束处的 3 个额外引号 (""")
- python - 为什么我的代码没有意识到 game = false?
- placeholder - 如何将占位符值添加到 ngmodel
- html - 即使设置了@media,列也没有响应?
- c# - Microsoft SendKeys 类中键“Volume UP”的代码是什么
- android - 如何在 android 中上传到服务器之前压缩 GIF 图像?
- flutter - 如何最小化 Flutter 应用程序的大小
- excel - 使用指定日期从一个工作簿复制到另一个工作簿
- php - 使用 firebase php 时出现错误,即 cURL 错误 35
- windows - 如何在 Powershell 中将多个字符串转换为 IP 地址,以便过滤掉 IPv6