首页 > 解决方案 > 当数据没有按性别分开时,如何单独检查性别分布?

问题描述

我必须检查数据是否具有男性和女性的 CREANZ 正态分布,但我的数据集混合了性别,我不知道如何将它们分开,以便我可以分别检查性别的分布。我之前做过以下事情:

df$Gender[df$Gender=="V"]=0.742
df$Gender[df$Gender=="M"]=1
df$Gender[df$Gender=="F"]=0.742
df$Gender<-as.numeric(df$Gender)
df$Gender<-as.numeric(df$Gender)

标签: rnormal-distribution

解决方案


如果您想获得更多答案,请查看可重现的示例。

您可以使用绘图和测试来检查正态性。如果您想进行测试,shapiro wilk 可能是一个不错的选择。使用管道:

df %>%
   dplyr::select(CREANZ, gender) %>%
   group_by(gender) %>%
   summarise(across(.fns = ~shapiro.test(.))) -> result
   

如果你只想要 p 值

df %>%
   dplyr::select(CREANZ, gender) %>%
   group_by(gender) %>%
   summarise(across(.fns = ~shapiro.test(.)$p.value)) -> result
   

推荐阅读