r - 仅基于 R 中的一列删除重复行
问题描述
我在 R 中有一个包含 1000 多行的数据框。其中一列是 eventID,并且有一些重复。我想删除行,以便所有事件 ID 都是唯一的。
例如,如果有 3 行 EVENT ID = 78,我想删除其中 2 行,但我不在乎哪 2 行。
我不想考虑任何其他列。
解决方案
我们可以使用duplicated
inbase R
只保留副本的第一行
subset(df1, !duplicated(EVENTID))
或distinct
从dplyr
library(dplyr)
distinct(df1, EVENTID, .keep_all = TRUE)
推荐阅读
- r - 如何在 R 中从 FTP 导入多个 CSV 文件
- docker - 无法与 docker 容器交互:停止、rm、检查...命令行刚刚卡住
- php - Laravel $errors 没有在刀片中显示
- typescript - 从快照中获取时间戳字段作为 Cloud Function Triggers 中的时间戳
- python - 在 Ubuntu 18.04 中运行程序(在 VMWare 中运行)时出现此错误:AssertionError: Torch not compiled with CUDA enabled
- bash - 使用 sdiff 比较来自两个远程 URL 的内容的 Bash 脚本
- c++ - 如何使目标依赖于特定的文件名?
- .net-core - 从 .Net Core 类库中的 appsettings.json 读取常量
- imagemagick - 强制图像魔法识别以 MB 为单位显示输出大小
- android - 具有多个按钮 OnClickListener 的 RecyclerView