首页 > 解决方案 > 总结 R 中的数据问题

问题描述

我需要为作业总结我的数据,但我不明白我怎么没有得到它。我是 R Studios 的一个庞大的新手,我已经尽我所能地放弃了 Uni 给我的建议(这太糟糕了)。

主要问题是:“总结过去一年内离婚或合法分居患者的住院人数。”

到目前为止,这就是我所在的位置:

r <- c("Single"= 1, "Other"= 2, "Divorced"= 3, "Married"= 4 )
Group123 <- VisED[(VisED$disposition = 1) & (VisED$maritalstatus)]

Admission 为 1,Discharged 为 0。向量是为了整理所有不同的关系状态'。我想也许我必须创建一个向量然后从那里开始?

目标是让所有入院的离婚患者分配给一个变量,然后继续计算平均值和 SD。

我也试过 maritalstatus=divorced 但这不起作用。

Group123 <- VisED[(VisED$disposition = 1) & (VisED$maritalstatus=divorced)]

我得到

Error in `[.data.frame`(VisED, (VisED$disposition = 1) & (VisED$maritalstatus = divorced)) : 

找不到对象“离婚”

总的来说,我很困惑,所以我可以提供任何建议或其他任何东西来让这更容易理解,然后让我知道。

谢谢!:))

编辑:尝试了一些评论后,我现在收到了这条消息

Error in `[.data.frame`(VisED, (VisED$disposition = 1) & (VisED$maritalstatus ==  : 

选择了未定义的列

响应这行代码:

Group123 <- VisED[(VisED$disposition = 1) & (VisED$maritalstatus == "divorced")]

我现在哪里出错了?

PS。再次抱歉

标签: rsummary

解决方案


有两件事,您需要,在逻辑语句之后放置一个,让他们知道您选择的是行,而不是列——如果您忽略它,它会假定您正在选择列,因此会出现未定义的列错误。其次,要选择列,您需要执行Group123$variable_name. 用你的变量名替换nadmissions下面。如果你只是这样做mean(Group123),你会得到那个错误,因为你试图取数据框的平均值,这是不允许的。

VisED=data.frame(nadmissions=1:10, disposition=rep(c(1, 0), each=5), maritalstatus=rep(c("divorced"), 10), stringsAsFactors = FALSE)
Group123 <- VisED[(VisED$disposition == 1) & (VisED$maritalstatus=="divorced"),]
variable=as.numeric(Group123$nadmissions)
mean(variable, na.rm=TRUE)
3

sd(variable, na.rm=TRUE)
1.581139

推荐阅读