首页 > 解决方案 > R. 根据条件改变新变量

问题描述

我有一个包含三个变量(v1、v2 和 v3)的数据框(zz)。我想根据某些条件对新变量 v4 进行变异。

  1. 如果 v3 <= 1 那么 v4=(v1+v2)/2....平均值。
  2. 如果 v3 > 1 则 v4 = V1 或 V2,以较大者为准。
  3. 如果 v1 或 v2 中的任何一个为 NA,则 v4 是非 NA 变量的值。
  4. 如果 v1 和 v2 都是 NA 那么 v4 也是 NA 下面的脚本生成示例数据,我开始解决
v1 <- c(4, 4, 4, 4, 3, 5, 6, 7, 2, NA )
v2 <- c(6, 2, 3, 3, 4, 4, 5, 7, NA, 4)
v3 <- c(2, 2, 1, 1, 1, 2, 1, 0, NA, NA)
zz <- data.frame(v1, v2, v3)

zz = mutate(zz, v4 = ifelse( v3<=1, (v1+v2)/2,
                     ifelse( ?????)

任何指导都会有所帮助

标签: rif-statementdplyr

解决方案


您可以使用case_when来指定条件。条件 3 和 4 可以使用coalesce.

library(dplyr)

zz %>%
  mutate(v4 = case_when(v3 <= 1 ~ (v1 + v2)/2, 
                        v3 > 1 ~ pmax(v1, v2), 
                        TRUE ~ coalesce(v1, v2)))
#   v1 v2 v3  v4
#1   4  6  2 6.0
#2   4  2  2 4.0
#3   4  3  1 3.5
#4   4  3  1 3.5
#5   3  4  1 3.5
#6   5  4  2 5.0
#7   6  5  1 5.5
#8   7  7  0 7.0
#9   2 NA NA 2.0
#10 NA  4 NA 4.0



推荐阅读