首页 > 解决方案 > 使用 R:根据不同的条件有效地删除行

问题描述

考虑到这个样本

df<-{data.frame(v0=c(1, 2, 5, 1, 2, 0, 1, 2, 2, 2, 5),v1=c('a', 'a', 'a', 'b', 'b', 'c', 'c', 'b', 'b', 'a', 'a'), v2=c(0, 10, 5, 1, 8, 5,10, 3, 3, 1, 5))}

对于大型数据框:如果 v0>4,则删除包含相应值 v1 的所有行(删除组?)。

因此,这里的结果应该是一个数据框删除所有带有“a”的行,因为“a”存在 5 的 v0 值。

df_ExpectedResult<-{data.frame(v0=c( 1, 2, 0, 1, 2, 2 ),v1=c( 'b', 'b', 'c', 'c', 'b', 'b'), v2=c(1, 8, 5,10, 3, 3))} 

另外,我希望有一个新的数据框来保存已删除的组。

df_Dropped <- {data.frame(v1='a')}

对于庞大的数据集,您将如何有效地做到这一点?我正在使用一个简单的 for 循环和 if 语句,但操作时间太长。

标签: rdataframelarge-datadrop

解决方案


使用subset+的基本 R 选项ave

subset(df, !ave(v0 > 4, v1, FUN = any))

  v0 v1 v2
4  1  b  1
5  2  b  8
6  0  c  5
7  1  c 10
8  2  b  3
9  2  b  3

推荐阅读