首页 > 解决方案 > Datadog 监控器在一个指标自另一指标以来的一段时间内未发生时发出警报

问题描述

我在设置监视器时遇到问题,该监视器会在另一个事件之后的一段时间内没有发生事件时提醒我。基本上,对于我的应用程序中的给定任务,我有一个指示“正在运行”状态的日志和另一个指示“完成”状态的日志。从这些日志中,我在 datadog 中定义了两个自定义指标。我正在尝试设置一个监视器,它会在任务开始运行后 2 小时内未完成时提醒我。因此,例如,如果在 2:00 观察到正在运行的指标,则监视器不应该在 4:00 之前提醒没有完成。如果在 4:00 之前观察到完成的指标,则监视器不会针对此任务发出警报。

我尝试实现这一点的方法是使用阈值监视器,并从完成的指标计数中减去运行指标的计数。然而,这里的挑战是时间增量部分。

我尝试过使用延迟评估(延迟 2 小时),但是,在它开始评估时,它只会考虑第一个指标。它基本上只是将窗口向后滑动。

标签: datadog

解决方案


推荐阅读