python - Pandas 中的 .corr() 方法有什么作用,它如何与热图相关联?
问题描述
我正在使用 jupyter 库做一个关于 EDA 的教程,发现这段代码令人困惑:-
plt.figure(figsize=(10,5))
c = df.corr()
sns.heatmap(c,cmap="BrBG", annot=True)
在这里,数据帧被定义为 df。但是,我不明白 df.corr() 的目的以及它与热图的关系。我尝试搜索 df.corr() 并发现它用于执行成对操作。
这是 jupyter 画廊的链接:https ://colab.research.google.com/github/Tanu-N-Prabhu/Python/blob/master/Exploratory_data_Analysis.ipynb#scrollTo=dAnd4DSyeHDb
希望能澄清我的问题。
解决方案
df.corr()
计算元素范围为 的相关矩阵[-1, 1]
,默认使用 Pearson 相关系数。sns.heatmap
只是一种使用颜色显示相关性有多强的方法,在这种情况下,绿色表明正相关接近1
.
这只是一种使用颜色而不是数字来查看相关性的方法,因此用户可以识别哪些变量的相关性更高。
推荐阅读
- python - 为什么在对元组进行排序时,我得到一个列表作为 sorted() 函数的最终输出?
- layout - 无法使用 Nebular NbLayoutComponent 在整个可用屏幕上显示页面内容
- python - 我想计算特定项目的数量
- python - 在本地机器上进行分布式 locust 负载测试
- python - 两个for循环内的条件和输出之间的切换?
- visual-studio-code - Visual Studio Code 返回一个 php xdebug 错误
- javascript - 异步函数未终止
- docker - 如何修复使用代码 1 退出的 Docker-compose up 的错误
- python - matplotlib:如何自定义 x 轴刻度间隔
- r - Abline 不适合条形图