r - 如何计算数据框中每个变量值组合发生的时间?
问题描述
我可以使用 distinct() 来获取所有唯一组合的数据框,现在我想获取每个唯一组合出现的次数。我使用的实际数据框有超过 10k 的组合,所以我无法手动计算它。
n=1000000
X = rbinom(size=1,n,p=0.3)
U = rbinom(size=1,n,p=0.5)
Y = rbinom(size=1,n,p=0.1)
dat<-data.frame(X, Y, U)
distinct(dat, X, U)
解决方案
您可以使用dplyr::count
,也可以dplyr::add_count
这样查看:
dplyr::count(dat, X, U)
# identical to
dplyr::group_by(dat, X, U) %>%
dplyr::summarise(n = n())
dplyr::add_count(dat, X, U)
推荐阅读
- javascript - 根据对象设置变量
- javascript - 在传递基本身份验证凭据时在 axios 上获取身份验证错误
- javascript - 如何比较js中对象的所有键?
- php - 循环中的数组循环需要两次 foreach?
- python - Pandas/Python:根据行值和其他 DataFrame 设置新列的值
- python - 摆脱 Pandas 中特定单元格的初始空格
- java - 在 Java 12+ 中更改静态最终字段
- reactjs - react-beautifull-dnd 限制项目数
- javascript - JSON 数组 - 从数组中选择
- ffmpeg - 我可以使用 ffmpeg 对程序生成的视频进行编码以进行直播吗?