首页 > 解决方案 > R中特定元素之间的相关性

问题描述

我试图在 R 中的变量中运行特定元素之间的相关性,但我找不到选择元素的方法。

我的数据框如下所示:[在此处输入图像描述][1] [1]:https://i.stack.imgur.com/DGZnu.png

我正在尝试选择“survived = 1”、“sex=female”、“pclass=2”和“age=10”。

关于如何让它发挥作用的任何想法?

标签: rcorrelation

解决方案


对于未来,正如@Ronak Shan 在评论中所说,创建一个最小可重现示例(MRE)并发布您失败的尝试来帮助社区帮助您!!!。我不知道我是否理解了您的问题,但是对于 r 中的子集数据框,有很多方法。在 base r 中,最直接的方法是:

set.seed(55)#for reproducibility
#simulate the data.frame you posted
df <-
data.frame(
id = 1:10,
survived = sample(c(0, 1), 10, replace = T),
pclass = sample(c(1:3), 10, replace = T),
sex = sample(c("M", "F"), 10, replace = T),
age=round(runif(10,10,15)),
sibsp = sample(c(1:3), 10, replace = T),
parch=sample(c(0:2), 10, replace = T)
)

#subset
new.df <- subset(df,survived==1&sex=="F"&pclass==2&age==10)
#same thing
new.df2 <-df[df$survived==1&df$sex=="F"&df$pclass==2&df$age==10,]

正如您所看到的,创建一个新的数据框是一个非常简单的解决方案,然后您可以对您感兴趣的数据进行相关性分析。从您的问题来看,它并没有准确显示您想要做什么,而是一个简单的相关性可以计算为:

cor(new.df)

但这会引发错误,因为只能为数值向量、矩阵或数据框计算相关性。

new.df.for.cor <- new.df[,-4]#drop out the "sex" column
cor(new.df.for.cor)

为了获得更好的解释,您必须编辑问题以添加有关您的数据和您想要获得的输出的更多信息。


推荐阅读