python - 如何在python中使用Z分数计算相关性?
问题描述
我在熊猫数据框中有类似于下表的数据:
Z(A) Z(B) Z(TARGET)
1 0.4 0.17 0.96
2 0.2 0.37 0.45
3 0.1 -0.4 1.1
...
那么,是否可以仅使用 z 分数(最好使用 pandas 库)来计算A
和B
的相关性?TARGET
我知道 pandas 库corr
在其DataFrame
类中有方法,并且我在这里看到了其他有关使用该方法的问题。但是这些问题中的数据是原始数据(即A
, B
, TARGET
),而我只有这些数据的 z 分数(即Z(A)
, Z(B)
, Z(TARGET)
)。我也可以将corr
函数应用于我的 Z 表,还是需要使用其他方法计算A
withTARGET
和B
with的相关性?TARGET
我知道这个问题更多的是关于数学而不是编程,所以,如果我把它贴错了地方,很抱歉。但它与两者都有关系。
解决方案
你不能在这里使用 corr ,至少不能单独使用。Pearson 相关性可以通过这个公式http://davidmlane.com/hyperstat/A51911.html从 z 分数获得。我会编写一个函数来求和,然后使用 for 循环和 df.iloc[] 遍历数据帧。它可能会足够快,只是不够漂亮。
推荐阅读
- google-chrome-devtools - “开始分析并重新加载页面”何时决定停止自动录制?
- arrays - 如何在许多 const react 中存储和导出对象数量
- javascript - ReactJS - 使用 setState 和 firebase 监听
- c++ - 半只读矩阵:实现迭代器解引用
- r - 在 R 中使用 GARCH 模型进行预测
- angular - 打字稿:键入 Date.getTime()
- c# - SmallDateTime 数据类型的迁移错误
- apache-spark - 如何使用“spark.catalog.createTable”函数创建分区表?
- python - 如何在不改变游戏 FPS 的情况下改变动画速度?
- java - 如何使用带有 setResultTransformer 和标量的 Hibernate 存储过程