首页 > 解决方案 > 相关矩阵不显示所有列python

问题描述

我正在尝试解决来自 Kaggle 的“房价”挑战,但我被困在我的相关矩阵上,因为它根本没有显示我想要的所有列。最初,显然是因为列数较多,所以我这样做了:

df = df_data[['SalePrice', 'MSSubClass', 'MSZoning', 'LotFrontage', 'LotArea', 'Street', 'Alley', 'LotShape', 'LandContour', 'Utilities']].copy()    

corrmax = df.corr()

f, ax = plt.subplots(figsize=(16,12))
sns.heatmap(corrmax, annot = True)

然后,由于某种原因,结果是只有 SalePrice、MSSubClass、LotFrontage 和 LotArea 的热图。谁能帮帮我吗?

标签: pythonpandasseabornheatmap

解决方案


如果您分析房价数据集 房价大约有 21-23 个分类变量 'MSZoning','Alley' corr() 矩阵仅显示它们之间的数值或非分类变量之间的关系

corrmax = df.corr()

如果要查找分类变量和非分类变量之间的关系,则需要使用Spearman 相关矩阵

您将从下面的链接中找到一些帮助...

分类变量和连续变量之间相关性度量的概述

标称 (IV) 和连续 (DV) 变量之间的相关性


推荐阅读