首页 > 解决方案 > 三类之间的具体比率如何计算?

问题描述

我正在尝试使用数据框“泰坦尼克号”来计算存活率。

我过滤了一个名为“Male_adult_passengers”的对象,其向量“类”包括三个等级。

还有另一列记录生存状况(“是”或“否”)

我想获得不同班级的存活率并进行比较。

我应用了 dplyr 包并尝试编码为:

Male_adult_passenger %>%
  group_by(Class) %>%
  summarise(S_rates = count(Survived = 'Yes')/count(Survived))

但只出现了一条错误消息:

Error in group_vars(x) : argument "x" is missing, with no default

这条消息是什么意思?我怎样才能获得所需的存活率?

非常感谢。

标签: r

解决方案


首先,下次请提供一个可重现的例子。例如,您可以轻松地做到这一点dput(Male_adult_passenger)

无论如何,该错误来自使用 assignmentSurvived = 'Yes'而不是 comparison Survived == 'Yes'

尝试解决这个问题,但我猜这count会很麻烦。如果它不起作用,请尝试:

Male_adult_passenger %>%
  group_by(Class) %>%
  summarise(S_rates = sum(Survived == 'Yes')/n())

如果这仍然不起作用,请通过编辑您的问题提供示例,我很乐意进一步查看。


推荐阅读