首页 > 解决方案 > 在 R 中使用不断变化的结果变量运行多个回归

问题描述

我有一个如下所示的数据框(df):

condition  dv1  dv2  dv3
1          2    4    3
2          5    7    4
3          7    1    2

为了同时运行多个回归,我使用了这样的代码:

dfdv <- df[,2:4]  
output <- lm(as.matrix(dfdv) ~ condition, data = df)
summary(output)

这为我提供了 dv1、dv2 和 dv3 的所有 dv ~ 条件回归。这些是输出中给出的回归:

dv1 ~ condition
dv2 ~ condition
dv3 ~ condition

但是,我现在想控制回归中的不同条件。具体来说,我想找出一种有效运行以下回归的方法。

dv1 ~ condition + dv1
dv1 ~ condition + dv2
dv1 ~ condition + dv3

我使用与上述类似的原理尝试了以下操作,但没有成功。

dfdv <- df[,2:4]  
output2 <- lm(dv1 ~ condition + as.matrix(dfdv), data = df)
summary(output2)

它给了我一个单一的回归,使用了一个回归中的所有 dv,而不是我想要的回归。这就是它给我的:

dv1 ~ condition + dv1 + dv2 + dv3

有谁知道我如何使用简单的代码执行这些回归分析?我的实际数据集中比我在这个例子中包含的更多。

标签: rregressionlinear-regressiontidyverse

解决方案


我们可以使用lapply它。遍历列名“dv”,reformulate通过指定响应和因变量创建公式,然后应用lm

v1 <- grep('^dv\\d+$", names(df), value = TRUE)
lapply(v1, function(dv) lm(reformulate(c(dv, "condition"),
           dv), data = df))

或创建公式paste

lapply(v1, function(dv) lm(paste0(dv, " ~ ", "condition + ", dv), data = df))

推荐阅读