r - 仅保留有条件的重复条目
问题描述
我正在清理数据集,我只需要保留那些重复 4 次的数据(如“a”和“b”),但是,我无法做到这一点。有人可以帮忙吗?
谢谢!
let <- c("a","a","a","a","b","b","b","b","c","c","c","d","d","e")
avg <- c(1,1,1,2,3,4,5,6,1,2,3,4,3,5)
sample <- data.frame(let,avg)
解决方案
我们可以用data.table
library(data.table)
setDT(sample)[, .SD[.N >=4], let]
# let avg
#1: a 1
#2: a 1
#3: a 1
#4: a 2
#5: b 3
#6: b 4
#7: b 5
#8: b 6
或base R
使用ave
sample[with(sample, ave(avg, let, FUN = length)>=4),]
或与table
subset(sample, let %in% names(which(rowSums(table(sample)) >=4)))
推荐阅读
- javascript - 修改主题时使用 Gatsby 防止 blog.js 中的重复条目
- javascript - 如何弄清楚 chrome devtools 中的弹出 URL 是如何派生的?
- java - Agora 视频通话黑屏
- c++ - 使用 cin.get 读取字符数组
- assembly - 使用链表的无限精度 NASM 计算器
- axios - 在 Nest.js 中使用 Axios 检测流下载中的网络错误的正确方法是什么?
- asp.net-core - 卷曲附加授权标头但控制器仍为 401
- python - sympy 是否给出错误的简化?
- javascript - D3 散点图未正确实现缩放交互
- firebase - 获取 TypeError:运行 firebase 模拟器时无法将对象转换为原始值:开始