r - 如何检查两个随机选择的响应是否匹配?
问题描述
我有一个数据集,其中 500 人随机回答 5 个问题,其中包含 275 个问题,范围为 1-5。
library(dplyr)
set.seed(13)
df <- tibble(id = rep(1:500, 5),
q = sample.int(n = 275, size = max(id)*5, replace = T),
ans = sample.int(n = 5, size = max(id)*5, replace = T))
我的任务是针对每个人,从 5 个回答(其他人也回答过的回答)中随机选择一个,并与随机选择的回答相同问题的其他人进行检查。如果两个响应相同,我将其标记为真,否则我将其标记为假。
我考虑通过根据多人回答的问题为每个人分配一个选定的问题来解决这个问题:
sampled_q <-
df %>%
group_by(q) %>%
mutate(n_times_answer = n()) %>%
filter(n_times_answer >= 2) %>%
group_by(id) %>%
sample_n(1) %>%
transmute(id, q, assigned = T)
df %>%
left_join(sampled_q)
但从这里我不知道如何处理支票。这也是低效的,因为一旦我检查了一个人的回复,我就检查了两个回复,所以我在技术上可以为两个人标记 T/F,尽管高效对我来说并不是高优先级。
我还考虑过重塑我的数据:
df %>%
pivot_wider(id_cols = id,
names_from = q,
values_from = ans) %>%
unnest(everything())
但我发现这很慢,我也被困在这里。
任何帮助,将不胜感激。
解决方案
从每个回答者那里抽取 1 个有效问题,然后将其加入df
.
df %>%
group_by(q) %>%
filter(n_distinct(id) > 1) %>% # Keep only questions that have more than one answerer
group_by(id) %>%
sample_n(1) %>% # Keep only one question from each answerer
inner_join(df, by = "q") %>% # Join it back on the main table to identify other answers to the same question
filter(id.x != id.y) %>% # Don't include answers from the same answerer
group_by(id.x) %>%
sample_n(1) %>% # Keep only one other answer
mutate(matched = ans.x == ans.y) # Check if the answers matched
#> # A tibble: 500 x 6
#> # Groups: id.x [500]
#> id.x q ans.x id.y ans.y matched
#> <int> <int> <int> <int> <int> <lgl>
#> 1 1 175 3 106 3 TRUE
#> 2 2 15 5 117 4 FALSE
#> 3 3 256 4 366 3 FALSE
#> 4 4 268 4 194 4 TRUE
#> 5 5 161 3 485 5 FALSE
#> 6 6 100 1 390 4 FALSE
#> 7 7 248 5 307 2 FALSE
#> 8 8 126 5 341 4 FALSE
#> 9 9 65 2 93 2 TRUE
#> 10 10 48 1 461 5 FALSE
#> # … with 490 more rows
推荐阅读
- javascript - 级联中的自动完成 - 错误 [object Object] 或未选择单词
- python - 如何让我的 For 循环将按钮的索引保存在另一个变量中?
- azure - Azure AD、活动域和无缝登录
- android - 如何从 SearchView 中获取可绘制的关闭按钮?
- javascript - 如何运行并发无限作业
- c++ - Poco::Net HTTPServer:如何检测断开连接的客户端?
- javascript - 在 TypeScript 中导出和使用 IIFE 类
- javascript - 无法读取未定义的属性
- excel - VBA 偏移和粘贴
- java - 无法运行 pom.xml