python - 了解 Seaborn 中的箱线图
问题描述
我有以下代码:
sns.set_style("whitegrid")
tips = sns.load_dataset("tips")
ax = sns.boxplot(y=tips["total_bill"])
这会产生以下图:演示图
我参考了这篇文章来了解箱线图如何演示数据的分布。在箱线图中,最上面的水平线被认为是最大值,最下面的水平线被认为是最小值。我的问题是:为什么水平线不在 50.81 而在 40 左右。我知道答案可能很简单,但我对箱线图一无所知,并且参考了上述文章。
解决方案
上面的水平线通常应该是数据的 (75th percentile + 1.5 IQR),而下面的水平线是 (25th percentile - 1.5IQR)。这里 IQR 代表四分位间距,即盒子的长度)。在箱线图中,上下须线之外的任何东西都被视为异常值,然后在演示图中用点标记。
推荐阅读
- javascript - Hyperledger Fabric API 返回缓冲区类型数据,如何在 javascript 中将缓冲区转换为该数据的字符串
- python - 如何使这 2 个 JSON 文件进行通信?
- c++ - 为什么程序级构造函数会被 __libc_csu_init 调用,而析构函数不会被 __libc_csu_fini 调用?
- ruby-on-rails - 使用模式(Rails、Heroku)构建数据库时出现 NoDatabaseError
- python - Tkinter 入口输出
- c# - 检索未读电子邮件并将其保留为收件箱中的未读
- outlook-addin - Outlook VSTO-AddIn:防止 Outlook 删除约会
- javascript - 以特定标准模式加载页面
- graphql - 使用 Amplify + GraphQL + DynamoDB 对电子商务网站进行数据建模
- c# - C# - 在种子方法中创建角色