python - 如何在 Pandas 中可视化缺失值模式
解决方案
您可以使用 matplot 获得所需的内容:
import pandas as pd
plt.rcParams["figure.figsize"] = (20, 10)
df = pd.read_excel("C:/Users/Jhonny/Desktop/titanic.xlsx")
plt.imshow(df.isnull(), cmap='hot', aspect='auto')
plt.show()
注意:我使用了来自 kaggle 的 Titanic 数据子集。
结果:
从索引 0 开始,此热图可视化立即告诉我们缺失值的分布方式(和位置)。
我知道,我现在没那么花哨。Matplot 需要更多的工作才能将这个原始图形变成更好的东西。
但如果你想要更好更快的东西,我真的建议seaborn
。
Seaborn
是一个基于 matplotlib的 Python 数据可视化库。它提供了一个用于绘制有吸引力和信息丰富的统计图形的高级界面。
import seaborn as sns
sns.heatmap(df.isnull(), cbar=False)
plt.show()
推荐阅读
- c# - AuthorizeRouteView Authorizing 和 NotAuthorized 参数设置
- spring-boot - Spring SmartLifeCycle 顺序行为?
- sql - 比较日期,一张表,mssql
- ios - 如何在 Swift 中使用正则表达式设置信用卡 PAN NUMBER 的模式?
- excel - WorksheetFunction 所需的对象
- java - 我的 appium 测试在一台设备上运行了两次,但我需要在两台设备上并行运行它
- java - 在 Java 中使用供应商传递方法引用
- c# - 孙子(及以后)项目的属性不被读取
- php - PHP选择具有相同ID的不同列
- arrays - 将 numpy.ndarray 中的两个单元格连接到一个单元格中