r - R - 你如何计算两个 group_by() 函数中关联的行数?
问题描述
我有一个数据集(参见下面的示例),其中每个人都经历了两个会话,每个会话有 4 个试验。在每次试验中,他们可以选择正确的 (1) 或错误的 (0),由y变量指定。我正在尝试计算每个会话中每个人的正确选择率。(这是一个示例数据集,真实的数据集更大并且有更多行,所以我不想手动执行此操作)
df
head(df, 16)
row name session_number y
1 1 Tom 1 1
2 2 Tom 1 1
3 3 Tom 1 0
4 4 Tom 1 0
5 5 Tom 2 1
6 6 Tom 2 0
7 7 Tom 2 1
8 8 Tom 2 0
9 9 Rob 1 0
10 10 Rob 1 1
11 11 Rob 1 0
12 12 Rob 1 1
13 13 Rob 2 0
14 14 Rob 2 1
15 15 Rob 2 0
16 16 Rob 2 1
例如,我想知道 Tom 在他的第一次训练中,在 0.50 次试验中选择正确。这是通过将 Y 相加并除以与“Tom”和“Session 1”相关联的行数来计算的。尽管在更大的数据集中,我似乎无法弄清楚如何计算这些行数。
我尝试使用 group_by() 和 mutate(),但我似乎仍然无法让它工作,因为 count() 不起作用。
by_name_by_session <- df %>%
group_by(df$name) %>%
group_by(session_number) %>%
mutate(rate = (sum(df$y)/count(df$name)))
提前感谢任何可以提供帮助的人!
解决方案
推荐阅读
- angular - 上传到 AngularFireStorage 后如何使用 getDownloadUrl() 检索下载 URL
- apache-kafka - kafka 客户端可以连接到在 docker 容器中运行的 kafka 服务器
- javascript - 如果 localstorage access_token 未定义,如何重定向回登录页面
- monetdb - 是否可以使用 monetdb/e 打开常规的 monetdb 数据库目录?
- .net - 如何注入asp.net mvc区域
- c# - 确定统一旋转角色的方向?
- python-3.x - 是否有生成具有相同灰度值的随机颜色的公式?
- spring - 如何找出spring boot starter web依赖中包含哪些jar
- python - 将页面添加到 Scrapy 缓存
- elasticsearch-high-level-restclient - 引导方法初始化异常 - Elasticsearch 7.8.0