首页 > 解决方案 > 使用 dplyr 计算分组数据中相关性的显着性

问题描述

我已经对数据进行了分组,我想为此测试几个基本的推理统计数据。

library(tidyverse)

df <- data.frame(x=runif(50, min = 0, max = 25),y=runif(50, min = 10, max = 25), group=rep(0:1,25))

df %>%
  group_by(group) %>%
  summarize(cor(x,y))

在这里我可以很容易地得到相关性,但我还需要检查它的统计意义。不幸的是,像cor.test这样的选项在dyplr. 有简单的解决方法吗?

标签: rdplyrpearson-correlationsignificance

解决方案


这可能是你想要的吗?

df %>%
    group_by(group) %>%
    summarize(cor.test(x,y)[["p.value"]])

问题是cor.test()返回一个列表而不是单个值,因此您需要从列表中选择您感兴趣的元素。


推荐阅读