r - R. 根据条件改变新变量
问题描述
我有一个包含三个变量(v1、v2 和 v3)的数据框(zz)。我想根据某些条件对新变量 v4 进行变异。
- 如果 v3 <= 1 那么 v4=(v1+v2)/2....平均值。
- 如果 v3 > 1 则 v4 = V1 或 V2,以较大者为准。
- 如果 v1 或 v2 中的任何一个为 NA,则 v4 是非 NA 变量的值。
- 如果 v1 和 v2 都是 NA 那么 v4 也是 NA 下面的脚本生成示例数据,我开始解决
v1 <- c(4, 4, 4, 4, 3, 5, 6, 7, 2, NA )
v2 <- c(6, 2, 3, 3, 4, 4, 5, 7, NA, 4)
v3 <- c(2, 2, 1, 1, 1, 2, 1, 0, NA, NA)
zz <- data.frame(v1, v2, v3)
zz = mutate(zz, v4 = ifelse( v3<=1, (v1+v2)/2,
ifelse( ?????)
任何指导都会有所帮助
解决方案
您可以使用case_when
来指定条件。条件 3 和 4 可以使用coalesce
.
library(dplyr)
zz %>%
mutate(v4 = case_when(v3 <= 1 ~ (v1 + v2)/2,
v3 > 1 ~ pmax(v1, v2),
TRUE ~ coalesce(v1, v2)))
# v1 v2 v3 v4
#1 4 6 2 6.0
#2 4 2 2 4.0
#3 4 3 1 3.5
#4 4 3 1 3.5
#5 3 4 1 3.5
#6 5 4 2 5.0
#7 6 5 1 5.5
#8 7 7 0 7.0
#9 2 NA NA 2.0
#10 NA 4 NA 4.0