首页 > 解决方案 > 有没有办法从 Plotly 的箱线图中提取异常值并将它们保存为数组格式?

问题描述

我一直在使用 plotly 处理时间序列数据和箱线图。我的数据刻度为 30 分钟,因此我将数据分组为每天(包含 48 个数据点)并绘制了每天的箱线图。箱线图。现在我正在尝试从箱线图中提取统计信息以将它们保存在一个数组中,以便以后保存在数据库中。

我使用 describe() 方法来获取详细信息,但它没有提供所有异常值。数据统计。我已经使用四分位数计算了胡须的上下栅栏。如果数据没有分组,我可以借助数据集中的栅栏值提取异常值。有没有办法直接从箱线图中获取这些信息,如果没有,我怎么能计算异常值?

以下是供参考的代码: df 'resampled' 包含所有数据点

data_grouped = resampled.groupby('day')
data_stats = data_grouped['Value'].describe()
print(data_stats)

data_stats['lower_fence'] = data_stats['25%'] - 1.5 * (data_stats['75%'] - data_stats['25%'])
data_stats['upper_fence'] = data_stats['75%'] + 1.5 * (data_stats['75%'] - data_stats['25%'])
print(data_stats)

标签: pandasplotlyboxplot

解决方案


推荐阅读