r - 计算 2 个数据帧中变量之间的相关性
问题描述
我正在尝试计算以下国家与美国的相关性。我有一个相对较大的数据集,在我的第一个 df 中有 80 多个变量和 3000 多个观察值,如下所示,所以我尝试使用 R 来自动化它而不是使用 excel。
我正在尝试计算第一个 df 中的国家(即德国、意大利、日本等)与第二个 df 中的美国的相关性。所以它应该去德国-美国,意大利-美国,日本-美国等等。
不太确定我应该如何开始 - 我应该循环第一个表中的每一列以与第二个表中的 USA 相关联吗?非常感谢您的帮助。
谢谢!
df1
日期 | 德国 | 意大利 | 日本 | 更多国家... |
---|---|---|---|---|
01-01-2020 | 1000 | 200 | 2304 | 更多数字... |
01-02-2020 | 2000 | 389 | 2098 | 更多数字... |
不断地
df2
日期 | 美国 |
---|---|
01-01-2020 | 500 |
01-02-2020 | 600 |
不断地
解决方案
像这样的东西应该可以解决问题:
library(dplyr)
df1 <-
tibble(
date = 2001:2010,
Germany = runif(10),
Italy = runif(10),
Japan = runif(10)
)
df2 <-
tibble(
date = 2001:2010,
USA = runif(10)
)
df.cor <-
df1 %>%
summarise(across(-one_of('date'), ~ cor(.x, df2$USA)))
df.cor
注意:您必须确保 和 之间的日期df1
一致df2
。您可以使用连接功能(例如left_join
)来确保这一点
推荐阅读
- python - 将系列更改为数据框并使用标签内的数字作为数据框的索引,另一部分作为列名
- r - 如何将 data.table 完全与变量一起使用?
- java - Maven - URI 是非分层的
- python-3.x - 在 cartopy 中指定纬度/经度标签位置(在某些侧面删除)
- macos - 为什么这个 x86 代码会引发段错误?
- wordpress - 如何将 Docker WordPress 文件从 initContainer 复制到 Kubernetes 中的 emptyDir?
- alteryx - 将多个具有不同架构的 Excel 工作表合并到一个 Excel 工作表中
- python - Python,通过字符串更改 var
- python - 在python3中理解循环字典到熊猫的一行
- ios - 如何在 SwiftUI 中使用 PKToolPicker 和 PKCanvasView