首页 > 解决方案 > 如何在 Pandas 中可视化缺失值模式

问题描述

我知道有用于可视化缺失值的包,例如missingno. 如何在不使用 Pandas 和 Matplotlib 的附加包的情况下可视化缺失值模式?我期望如下图所示,其中丢失的数据是白色的:

在此处输入图像描述

标签: pythonpandasmatplotlibmissing-data

解决方案


您可以使用 matplot 获得所需的内容:

import pandas as pd
plt.rcParams["figure.figsize"] = (20, 10)
df = pd.read_excel("C:/Users/Jhonny/Desktop/titanic.xlsx")
plt.imshow(df.isnull(), cmap='hot', aspect='auto')
plt.show()

注意:我使用了来自 kaggle 的 Titanic 数据子集。

结果:

从索引 0 开始,此热图可视化立即告诉我们缺失值的分布方式(和位置)。

在此处输入图像描述

我知道,我现在没那么花哨。Matplot 需要更多的工作才能将这个原始图形变成更好的东西。

但如果你想要更好更快的东西,我真的建议seaborn

Seaborn是一个基于 matplotlib的 Python 数据可视化库。它提供了一个用于绘制有吸引力和信息丰富的统计图形的高级界面。

import seaborn as sns
sns.heatmap(df.isnull(), cbar=False)
plt.show()

在此处输入图像描述


推荐阅读