首页 > 解决方案 > 如何获得基于时间的高标准偏差数据的置信区间?

问题描述

我正在分析一些延迟(以秒为单位)。我的想法是找到适合 95% 结果的置信区间,这样我就可以对 PDF 有所了解。

从外观上看,我得到的更常见的延迟都在 30 秒以下,但最终系统中出现了一些问题,最多可以给我 25 分钟。这与我无关,因为系统工作的节奏约为每个周期 1 小时。

我的观点是,在时间相差如此之大的情况下,我的置信区间似乎“不公平”。这是我使用标准偏差得到的置信区间示例:

使用标准差的置信区间(来自 scipy stats)

我的想法是找到最合适的 PDF,获取它的参数,然后单独使用它来找到我的置信区间。我测试了几个不同的分布,实际上得到了 JohnsonSU 和最适合这个数据的分布。这里是:

最适合我的数据的 PDF

我是否可以单独使用 JohnsonSU 的参数,而不使用我的数据,以便找到可接受的置信区间?

标签: pythonscipyconfidence-intervaldata-fitting

解决方案


您可以通过以下表达式获得置信区间:

(平均-(标准/平方(n)),平均+(标准/平方(n)))。如果您的分布是标准的并且您知道人口标准。

否则,您需要检查适合您的发行版的特定表达式。


推荐阅读