r - dplyr 滞后调用中意外的整洁评估行为
问题描述
我有一个函数,它需要一个数据框和几个变量,我希望它使用整洁的评估原则产生一组滞后变量。在它的简单形式中,它看起来像这样:
library(dplyr)
cor_lags <- function(df, var1, var2) {
var1 <- enquo(var1)
var2 <- enquo(var2)
df %>%
select(!!var1, !!var2) %>%
mutate(lag1 = lag(!!var2, 1),
lag2 = lag(!!var2, 2),
lag3 = lag(!!var2, 3),
lag4 = lag(!!var2, 4),
lag5 = lag(!!var2, 5),
lag6 = lag(!!var2, 6))
}
但是,这会NA
为所有滞后变量生成值。
cor_lags(dts_wide,"P26","P1")
# A tibble: 24 x 8
P26 P1 lag1 lag2 lag3 lag4 lag5 lag6
<dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <chr>
1 84332. 2258. NA NA NA NA NA NA
2 63995. 2752. NA NA NA NA NA NA
3 86208. 10126. NA NA NA NA NA NA
4 103455. 3767. NA NA NA NA NA NA
5 160524. 12986. NA NA NA NA NA NA
6 306683. 3944. NA NA NA NA NA NA
7 599589. 3695. NA NA NA NA NA NA
8 642343. 6202. NA NA NA NA NA NA
9 482021. 8769. NA NA NA NA NA NA
10 220949. 5059. NA NA NA NA NA NA
有没有理由!!评估员不在lag
通话范围内工作?他们显然在select
通话中工作。
上述调用的预期行为在实践中应该像这段代码一样工作(有效):
# Expected
cor_lags <- function(df, var1, var2) {
var1 <- enquo(var1)
var2 <- enquo(var2)
df %>%
select(!!var1, !!var2) %>%
mutate(lag1 = lag(P1, 1),
lag2 = lag(P1, 2),
lag3 = lag(P1, 3),
lag4 = lag(P1, 4),
lag5 = lag(P1, 5),
lag6 = lag(P1, 6))
}
正如预期的那样,它会产生:
cor_lags(dts_wide,"P26","P1")
# A tibble: 24 x 8
P26 P1 lag1 lag2 lag3 lag4 lag5 lag6
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 84332. 2258. NA NA NA NA NA NA
2 63995. 2752. 2258. NA NA NA NA NA
3 86208. 10126. 2752. 2258. NA NA NA NA
4 103455. 3767. 10126. 2752. 2258. NA NA NA
5 160524. 12986. 3767. 10126. 2752. 2258. NA NA
6 306683. 3944. 12986. 3767. 10126. 2752. 2258. NA
7 599589. 3695. 3944. 12986. 3767. 10126. 2752. 2258.
8 642343. 6202. 3695. 3944. 12986. 3767. 10126. 2752.
9 482021. 8769. 6202. 3695. 3944. 12986. 3767. 10126.
10 220949. 5059. 8769. 6202. 3695. 3944. 12986. 3767.
解决方案
您正在混淆准引用语法。任何一个
替换
enquo
为sym
(或rlang::sym
)将字符串转换为符号,cor_lags <- function(df, var1, var2) { var1 <- sym(var1); # Turn string into symbol var2 <- sym(var2); # Turn string into symbol df %>% select(!!var1, !!var2) %>% mutate(lag1 = lag(!!var2, 1), lag2 = lag(!!var2, 2), lag3 = lag(!!var2, 3), lag4 = lag(!!var2, 4), lag5 = lag(!!var2, 5), lag6 = lag(!!var2, 6)) } cor_lags(mtcars, "mpg", "disp") %>% head() # var1, var2 as string # mpg disp lag1 lag2 lag3 lag4 lag5 lag6 #1 21.0 160 NA NA NA NA NA NA #2 21.0 160 160 NA NA NA NA NA #3 22.8 108 160 160 NA NA NA NA #4 21.4 258 108 160 160 NA NA NA #5 18.7 360 258 108 160 160 NA NA #6 18.1 225 360 258 108 160 160 NA
或为 and 提供不带引号的表达式
var1
并将var2
它们转换为 quosuresenquo
cor_lags <- function(df, var1, var2) { var1 <- enquo(var1) # Turn expression into quosure var2 <- enquo(var2) # Turn expression into quosure df %>% select(!!var1, !!var2) %>% mutate(lag1 = lag(!!var2, 1), lag2 = lag(!!var2, 2), lag3 = lag(!!var2, 3), lag4 = lag(!!var2, 4), lag5 = lag(!!var2, 5), lag6 = lag(!!var2, 6)) } cor_lags(mtcars, mpg, disp) %>% head() # var1, var2 as expressions # mpg disp lag1 lag2 lag3 lag4 lag5 lag6 #1 21.0 160 NA NA NA NA NA NA #2 21.0 160 160 NA NA NA NA NA #3 22.8 108 160 160 NA NA NA NA #4 21.4 258 108 160 160 NA NA NA #5 18.7 360 258 108 160 160 NA NA #6 18.1 225 360 258 108 160 160 NA
推荐阅读
- asp.net-mvc - 在 MVC 视图中显示 Active Directory 组
- algorithm - 如果存在包含子序列 A 和 B 但不包括 F 的字符串的算法
- java - Java 和递增字符串
- python - 来自 keras_contrib 问题的 Densenet
- html - 右对齐弹性项目并垂直居中其内容
- java - 数字签名错误 - 签名长度不正确:得到 344 但预期为 256
- azure - WindowStart 的 ADF v2 等效项是什么?
- java - Android:Firebase查询值中的单个单词
- vb.net - 运行对象表
- mpi - MPI_Bsend 的缺点?