python - 为什么我在 python 的 spearman 相关中得到 nan
问题描述
我scipy
用来计算相关性。我计算斯皮尔曼相关性的代码如下。
from scipy import stats
sequence_1 = [1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0]
sequence_2 = [0, 0.009783728115345005, 0, 0, 0.0019759230121848587, 0.0007535430349118562, 0.0002661781514710257, 0, 0, 0.0007835762419683435]
myspearman = stats.spearmanr(sequence_1,sequence_2)
print(myspearman)
我从代码中得到以下结果。
SpearmanrResult(correlation=nan, pvalue=nan)
尽管这个主题中有一些 SO 问题,但它们并没有专门回答我的问题。
我的问题如下。
- 我想以某种方式为我的相关性获得一个值。从这个意义上说, 的等效值是
nan
多少? - 我的另一个问题是;有没有办法避免这种情况并在 python 中获取实际值?
如果需要,我很乐意提供更多详细信息。
解决方案
为什么
spearmanr
输出 aNaN
?
没有变化,sequence_1
因此它的标准偏差等于 0,这将导致spearmanr()
函数中的零除,从而返回 a NaN
。
在这种情况下,等效值是
NaN
多少?
从数学上讲,当两个列表之一中的标准差等于 0 时(其中随机变量的所有实例都采用完全相同的值) ,Spearman 相关系数是未定义的。我建议您研究这里的公式, 以更好地理解为什么如果这不简单!
有没有办法避免这种情况并在 Python 中获取实际值?
由于实际值未定义,因此您确实可以使用 a 获得正确的值NaN
。但是,您可能希望依赖其他公式来解决此类问题,例如两个变量之间的协方差 - 在这种情况下,协方差将等于零。
推荐阅读
- tfs - Android项目的Gitlab到TFS迁移
- flutter - 由于 cloud_firestore androidX 兼容性而导致运行错误
- flask - 根据用户类型将字段设置为只读,使用 form_widget_args、Flask、SQLAlchemy
- bash - 如何安排命令在多个非子进程完成后运行?
- database - 如何在postgresql中比较来自不同数据库的表数据?
- c - 函数打印键盘值而不是 C 中的字符
- java - 使用 java Streams 更新地图值
- python - Pandas 中的 VLookup 使用合并
- r - 替代 R 中的子集?
- java - 在arraylist中创建新对象