首页 > 解决方案 > R Sandwich 包是否没有生成预期的聚集稳健标准错误?

问题描述

加载数据

utils::data("InstInnovation", package = "sandwich")

df <- InstInnovation

创建组合“公司”和“年份”的组变量

df[['cluster_var']] <- factor(paste0(df$company,"-",df$year))

线性回归模型

model <- lm(sales ~ competition + log(capital/employment) + year, data = df)

为什么这个:

lmtest::coeftest(model, vcov = vcovCL(model, type="HC3", cluster=~company+year))

产生与此不同的标准错误?

lmtest::coeftest(model, vcov = vcovCL(model, type="HC3", cluster=~cluster_var))

不应该cluster=~company+yearcluster=~cluster_var等价吗?

此外,我找不到一个地方(例如 Github)来报告 R 三明治包的问题,​​我找到了这个但只是一个只读镜像:https ://github.com/cran/sandwich

非常感谢您提前。

标签: rpackagecluster-computinglinear-regressionrobust

解决方案


cluster=~company+year确实是不同的东西:'多路聚类'。我在这里找到了解释:

http://fmwww.bc.edu/repec/bost10/BOS10.baum.pdf

https://francish.netlify.app/post/note-on-robust-standard-errors/


推荐阅读