首页 > 解决方案 > R:当重复值在下面的行中时删除一行

问题描述

我正在尝试通过删除不需要的行来清理数据集。这是我的数据集示例:第一张图片显示了数据集,第二张图片显示了我想要实现的目标。所以我试图删除所有具有相似 ID 但只保留顶部的行。

在此处输入图像描述

在此处输入图像描述

标签: rduplicatesdata-cleaning

解决方案


您可以使用group_by计数器cumsum,然后过滤掉所有后续 ID:


df %>%
  group_by(ID) %>%
  mutate(counter = cumsum(!is.na(ID))) %>%
  ungroup() %>%
  filter(counter == 1) %>%
  select(-counter)



推荐阅读