首页 > 解决方案 > Pandas 中的 .corr() 方法有什么作用,它如何与热图相关联?

问题描述

我正在使用 jupyter 库做一个关于 EDA 的教程,发现这段代码令人困惑:-

plt.figure(figsize=(10,5))
c = df.corr()
sns.heatmap(c,cmap="BrBG", annot=True)

在这里,数据帧被定义为 df。但是,我不明白 df.corr() 的目的以及它与热图的关系。我尝试搜索 df.corr() 并发现它用于执行成对操作。

这是 jupyter 画廊的链接:https ://colab.research.google.com/github/Tanu-N-Prabhu/Python/blob/master/Exploratory_data_Analysis.ipynb#scrollTo=dAnd4DSyeHDb

希望能澄清我的问题。

标签: pythonpandasseaborn

解决方案


df.corr()计算元素范围为 的相关矩阵[-1, 1],默认使用 Pearson 相关系数。sns.heatmap只是一种使用颜色显示相关性有多强的方法,在这种情况下,绿色表明正相关接近1.

这只是一种使用颜色而不是数字来查看相关性的方法,因此用户可以识别哪些变量的相关性更高。


推荐阅读