首页 > 解决方案 > 了解 Seaborn 中的箱线图

问题描述

我有以下代码:

sns.set_style("whitegrid")
tips = sns.load_dataset("tips")
ax = sns.boxplot(y=tips["total_bill"])

这会产生以下图:演示图
我参考了这篇文章来了解箱线图如何演示数据的分布。在箱线图中,最上面的水平线被认为是最大值,最下面的水平线被认为是最小值。我的问题是:为什么水平线不在 50.81 而在 40 左右。我知道答案可能很简单,但我对箱线图一无所知,并且参考了上述文章。

标签: pythondata-visualizationseabornboxplot

解决方案


上面的水平线通常应该是数据的 (75th percentile + 1.5 IQR),而下面的水平线是 (25th percentile - 1.5IQR)。这里 IQR 代表四分位间距,即盒子的长度)。在箱线图中,上下须线之外的任何东西都被视为异常值,然后在演示图中用点标记。


推荐阅读