python - Python DataFrame 相关性超过 1.0?
问题描述
我使用了 DataFrame.corr() 函数来确定 5000x1000 矩阵的所有输入变量之间的相关性:
correlation_matrix = df.corr()
当我检查相关矩阵的最大值时,我收到一个略大于 1.. 的数字:
correlation_matrix.max().max()
= 1.000029
当我通过以下检查进一步调查时:
counter = 0
for i in range(len(correlation_matrix.columns)):
for j in range (len(correlation_matrix)):
if correlation_matrix.iloc[i,j] > 1.0:
counter += 1
..事实证明,其中大约 100 个实际上略高于 1,这应该是不可能的。这可能是什么原因?
解决方案
推荐阅读
- python-3.x - 通过字典列表过滤,使用 Python 在 mongoDB 中查找数据
- c - C语言中的一个函数不起作用,是什么原因?
- c++ - QObject 与 std::vector 连接错误
- amazon-web-services - AWS SES 模板中是否有预定义的模板参数
- excel - VBA 如果值与特定 Dim 的名称相同,则获取值的 Dim
- sql - 默认日期雪花:无效标识符“日期”
- github - Raku 的 VS Code 中的多行注释
- c# - 使用 EF6 和 MySQL 克隆实体时出现死锁
- vba - 根据内容选择组合框中的项目
- python - Span 的内联 pandas_bokeh 语法