r - R中数据框和数据框列表之间的相关性
问题描述
我想计算数据框和数据框列表之间的相关性。这是我的示例:
library(lubridate)
v1 = seq(ymd('2000-05-01'),ymd('2000-05-10'),by='day')
v2 = seq(2,20, length = 10)
v3 = seq(-2,7, length = 10)
v4 = seq(-6,3, length = 10)
df1 = data.frame(Date = v1, Tmax = v2, Tmean = v3, Tmin = v4)
v1 = seq(ymd('2000-05-01'),ymd('2000-05-10'),by='day')
v2 = seq(3,21, length = 10)
v3 = seq(-3,8, length = 10)
v4 = seq(-7,4, length = 10)
abc = data.frame(Date = v1, ABC_Tmax = v2, ABC_Tmean = v3, ABC_Tmin = v4)
v1 = seq(ymd('2000-05-01'),ymd('2000-05-10'),by='day')
v2 = seq(4,22, length = 10)
v3 = seq(-4,9, length = 10)
v4 = seq(-8,5, length = 10)
def = data.frame(Date = v1, DEF_Tmax = v2, DEF_Tmean = v3, DEF_Tmin = v4)
v1 = seq(ymd('2000-05-01'),ymd('2000-05-10'),by='day')
v2 = seq(2,20, length = 10)
v3 = seq(-2,8, length = 10)
v4 = seq(-6,3, length = 10)
ghi = data.frame(Date = v1, GHI_Tmax = v2, GHI_Tmean = v3, GHI_Tmin = v4)
df2 <-list(abc, def, ghi)
names(df2) = c("ABC", "DEF", "GHI")
我想要 df1 和 df2 之间的所有相关系数,但只有列。
例如:
- df1$Tmax 和所有 df2*Tmax 列
- df1$Tmean 和所有 df2*Tmean 列
- df1$Tmin 和所有 df2*Tmin 列
我知道我可以像这样访问所有 Tmax 列:
lapply(df2, "[[", 2)
我知道如何计算 2 个单值之间的相关性:
cor.test(df1$Tmax, df2$ABC$ABC_Tmax, method = "spearman")
但是我怎样才能一次为所有列做呢?我试过这个,它不起作用:
cor.test(df1$Tmax, lapply(df2, "[[", 2), method = "spearman")
有任何想法吗?
解决方案
您可以lapply
结合使用mapply
来从测试中应用cor.test
和提取特定值。例如,得到p.value
,estimate
我们可以做
lapply(2:4, function(i) mapply(function(x, y) {
a <- cor.test(x, y, method = "spearman")
c(setNames(a$p.value, "pvalue"), a$estimate)
}, lapply(df2, "[[", i), df1[i]))
推荐阅读
- gluon - 不幸的是 GluonApplication 已停止
- node.js - 在节点 js 中使用 await 但它似乎不起作用
- qt - 从 QDataStream 读取到 QVector:应用程序因 SIGABRT 信号而崩溃
- php - 如何在php中获取cookie?
- vba - VBA Word在文本文档中定位和替换日期
- azure - Azure Functions:执行 python 类
- java - 带有 Bootstrap/REST 的 Jersey 的 web.xml 配置/结构
- phpmyadmin - 当 xdebug.scream = 1 时 OpenServer phpmyadmin 警告
- linux - Vim 复制一个块并粘贴到多行
- javascript - .pdf 文件在 npm run build 后无法正常工作