r - 在 R 中使用聚类运行多个回归
问题描述
当我需要运行多个回归时,我通常使用以下代码。
outcomes <- colnames(df[,1:10]) #specifies column names for variables
form <- paste(outcomes, "~ covariate1 + covariate2)
model <- form %>%
set_names(outcomes) %>%
map(~lm(.x, data = df))
map(model, summary)
然后,这给了我所有结果变量在 covariate1 + covariate2 上的回归输出。
我正在尝试做同样的事情,但使用聚集的稳健标准错误。我使用了 estimatr 包中的 lm_robust。这是我对上述代码所做的修改。
outcomes <- colnames(df[,1:10])
form <- paste(outcomes, "~ covariate1 + covariate2)
model <- form %>%
set_names(outcomes) %>%
map(~lm_robust(.x, data = df, clusters = id))
map(model, summary)
如您所见,我已将 lm 更改为 lm_robust 并添加了一个参数来指定我想要集群的级别。当上面的代码有效时,为什么这不起作用?您建议修改什么以使此代码运行?
我也对同时运行集群和非集群回归的全新方法持开放态度。
解决方案
lm
和之间的主要区别在于lm_robust
第一个参数,lm
接受一个公式对象或一个可强制转换的对象。
library(estimatr)
library(purrr)
因此,将公式对象作为字符串传递适用于lm
lm("mpg~gear+carb", data = mtcars)
这与
lm(mpg~gear+carb, data = mtcars)
但这不适用于lm_robust
lm_robust("mpg~gear+carb", data = mtcars)
公式 [[2]] 中的错误:下标超出范围
它只需要一个公式对象。
lm_robust(mpg~gear+carb, data = mtcars)
# Estimate Std. Error t value Pr(>|t|) CI Lower CI Upper DF
#(Intercept) 7.28 2.984 2.44 2.11e-02 1.17 13.38 29
#gear 5.58 0.933 5.98 1.69e-06 3.67 7.48 29
#carb -2.75 0.366 -7.53 2.64e-08 -3.50 -2.01 29
因此,将字符串更改为代码中的公式对象,它应该可以工作。
model <- form %>%
set_names(outcomes) %>%
map(~lm_robust(as.formula(.x), data = df, clusters = id))
推荐阅读
- sql - SQL - 恢复列连接
- django - 无法将本地 Postgre 数据库推送到 Heroku
- debugging - NS3_Can't run vanet-routing-compare.cc
- python - sankey 图的绘图为空
- javascript - Rails 部分运行 JS
- php - Livewire 在尝试对 ... 组件进行水合时遇到损坏的数据
- sql - 如何从 oracle 触发器更改为 oracle 复合触发器?
- reactjs - 动态添加元素时,状态保持在该元素内的默认值
- pentaho-spoon - 区分连字符 [-] 和负号 [-2.22]
- r - 如何自动计数()每个变量