首页 > 解决方案 > 如果另一列包含值,则过滤列值

问题描述

本质上,如果另一列包含值,我想过滤一列。这是一个例子:

my_df <- data.frame(x = c(1,1,1,2,2,2),
           y = c(1,2,3,4,5,6)) 
> my_df
  x y
1 1 1
2 1 2
3 1 3
4 2 4
5 2 5
6 2 6

让我们过滤x!=1当且仅当y!=1。这是我的预期结果:

  x y
1 1 1
2 2 4
3 2 5
4 2 6

标签: rfilterdplyrconditional-statements

解决方案


我们可以在group_by filter这里使用

library(dplyr)
my_df %>%
   group_by(x) %>% 
   filter(if(any(y == 1)) y == 1 else TRUE)
# A tibble: 4 x 2
# Groups:   x [2]
#      x     y
#  <dbl> <dbl>
#1     1     1
#2     2     4
#3     2     5
#4     2     6

或者如果它不需要分组

my_df %>%
   filter( (x == 1 & y == 1)|(x !=1))

或与subset

subset(my_df,  (x == 1 & y == 1)|(x !=1))
#  x y
#1 1 1
#4 2 4
#5 2 5
#6 2 6

或者

subset(my_df,  (x == 1 & y == 1)|(x !=1 & y != 1))

推荐阅读