首页 > 解决方案 > 从R中的重复序列中选择具有最大数量的所有行

问题描述

我有一个非常大的数据框,重复测量,但没有可用于分组的列。选择所需行的关键是获取 max(id) 考虑到重复序列是从 0 到 7 这样:

temperature   weekday   id
32            monday    0
34            thursday  0
34            saturday  1
55            wednesday 2
43            friday    0
45            sunday    1
42            friday    0

所需的输出(序列中的最大 id):

temperature   weekday   id
32            monday    0
55            wednesday 2
45            sunday    1
42            friday    0

标签: rdplyr

解决方案


听起来您想选择 nextid不高于 current的每一行id。与dplyr

your_data %>% filter(lead(id, default = 0) <= id)

(默认确保包含最后一行数据。)


推荐阅读