python - 如何在 Python 中绘制带有异常值和四分位数的箱线图
问题描述
我的箱线图显示正确,但我无法理解异常值和四分位数。我的箱线图如下所示
这是我的代码
df = pd.read_csv(r'posts_dataset.csv')
df.boxplot(by='city', column=['price'], color='red')
plt.show()
如何将其绘制为具有异常值和矩形形状的其他正式箱线图?
解决方案
很可能你price
有一些巨大的异常值或者它有一个沉重的尾巴,例如:
df = pd.DataFrame({'price':np.random.negative_binomial(0.1, 0.0001,5000),
'city':np.random.choice(['A','B','C'],5000)})
df.hist(column='price')
如果你做一个箱线图,它将被压扁:
df.boxplot(by='city', column=['price'], color='red')
一种选择是采用 log10 :
df['log_price'] = np.log10(df['price']+1)
df.boxplot(by='city', column='log_price', color='red')
推荐阅读
- python - binance api上的“时间戳提前1000毫秒”错误?
- javascript - JavaScript:如果它在一个字段上具有固定费率,则获取 clearname
- c++ - 使用 std::vector 时的简单 Boost UDP 接收器 gest heap-use-after-free
- javascript - 基于组件的网站设计中的 javascript 或 html 标题
- excel - 使用 VBA 通过自动填充插入行
- node.js - 提及特定路径后,如何在 Auth0 回调中允许 URL 列表
- node.js - 如何在 discord.js 上发出“说”命令?
- angular - 构建电容器时没有导出成员“需要”
- reactjs - 阻止所有组件渲染
- python - Word 内容控制 - 字段:从字段中的数据自动生成文档上的 QR 码