r - 如何计算R中的列的唯一值
问题描述
我有一个数据库,想知道有多少人(由 ID 标识)匹配一个特征。清单是这样的:
111 A
109 A
112 A
111 A
108 A
我只需要计算有多少'ID'具有该功能,问题是有重复的ID。我试过了
count(df, vars = ID)
但它不显示 ID 的总数,只是重复了多少次。与
count(df, c('ID')
因为它显示了 ID 的总数并且其中许多是重复的,所以我需要计算一次。
你有什么建议吗?由于该数据库的大小,不能选择使用表函数。
解决方案
您可以先使用删除重复项unique
,然后count
使用剩余的行:
d <- tribble(
~ID,~feature,
111, "A",
109, "A",
112, "A",
111, "A",
108, "A")
count(unique(d,vars = c(ID, feature)),vars=ID)
vars n
<dbl> <int>
1 108 1
2 109 1
3 111 1
4 112 1
推荐阅读
- regex - 在正则表达式或语法标记中捕获嵌套结构内的内容
- javascript - Datepicker 在克隆容器中不起作用
- python - R-Squared、MSE、MAE 作为模型评估技术来比较回归结果
- java - 作为 JPackage 安装的一部分,如何在 linux 中使本机 linux 应用程序可执行
- django - 使用从相关模型中过滤的 id 列表过滤模型中的数据
- javascript - 如何从嵌套在js对象数组中的数组中删除sessionID:null值对象
- node.js - React Typescript SSR 与 monorepo 项目结构
- android - 使用方向调整安卓手机屏幕亮度
- azure - React-Native 上的 Azure 室内地图
- linq - 使用 sort 参数按对象属性对列表进行排序