首页 > 解决方案 > 使用 dplyr 选择每个组中的最后一行很慢

问题描述

我有以下 R 代码。本质上,我要求 R 根据邮政编码和 paon 排列数据集,然后按 id 对它们进行分组,最后只保留每组中的最后一行。但是,R 需要 3 个多小时才能完成此操作。

我不确定我的代码做错了什么,因为这里没有 for 循环。

epc2 是一个有 324,368 行的向量。

epc3 <- epc2 %>%
  arrange(postcode, paon) %>% 
  group_by(id) %>% 
  do(tail(., 1)) 

感谢您提供的所有帮助。

标签: rperformancedplyr

解决方案


怎么样:

mtcars %>% 
  arrange(cyl) %>% 
  group_by(cyl) %>% 
  slice(n())

推荐阅读