stata - 多项 Logit 固定效应:Stata 和 R
问题描述
我正在尝试mlogit
在 Stata 中运行具有年份固定效应的多项 logit(面板数据:年份国家),但我没有得到某些模型的标准错误。当我multinom
在 RI 中运行相同的模型时,得到系数和标准误差。
我不经常使用 Stata,所以我可能会遗漏一些东西,或者我可能在 Stata 和 R 中运行不同的模型,因此不应该首先比较它们。可能会发生什么?
因此,有关感兴趣模型的简单版本的一些细节:
我创建了一个数据示例来说明问题所在
具有-1、0、1(无序和0作为参考)3个类别的因变量(将其称为DV1)
自变量:2 个连续变量、3 个二元变量、3 个二元变量中的 2 个的交互作用
年份:1995-2003
模型中的观察次数:900
在 RI 中运行代码并获得系数和标准误差,如下所示。
R 版本的代码创建数据和运行模型:
## Fabricate example data
library(fabricatr)
data <- fabricate(
N = 900,
id = rep(1:900, 1),
IV1 = draw_binary(0.5, N = N),
IV2 = draw_binary(0.5, N = N),
IV3 = draw_binary(0.5, N = N),
IV4 = draw_normal_icc(mean = 3, N = N, clusters = id, ICC = 0.99),
IV5 = draw_normal_icc(mean = 6, N = N, clusters = id, ICC = 0.99))
library(AlgDesign)
DV = gen.factorial(c(3), 1, center=TRUE, varNames=c("DV"))
year = gen.factorial(c(9), 1, center=TRUE, varNames=c("year"))
DV = do.call("rbind", replicate(300, DV, simplify = FALSE))
year = do.call("rbind", replicate(100, year, simplify = FALSE))
year[year==-4]= 1995
year[year==-3]= 1996
year[year==-2]= 1997
year[year==-1]= 1998
year[year==0]= 1999
year[year==1]= 2000
year[year==2]= 2001
year[year==3]= 2002
year[year==4]= 2003
data1=cbind(data, DV, year)
data1$DV1 = relevel(factor(data1$DV), ref = "0")
## Save data as csv file (to use in Stata)
library(foreign)
write.csv(data1, "datafile.csv", row.names=FALSE)
## Run multinom
library(nnet)
model1 <- multinom(DV1 ~ IV1 + IV2 + IV3 + IV4 + IV5 + IV1*IV2 + as.factor(year), data = data1)
当我mlogit
在 Stata 中使用(没有固定效果)运行模型时,我得到了系数和标准误差。
因此,我尝试使用 Stata 三种不同的方式在模型中包含年份固定效应,但均未奏效:
femlogit
- 不允许使用因子变量和时间序列运算符
- depvar 和 indepvars 可能不包含因子变量或时间序列运算符
mlogit
- fe 选项:fe 不允许
- used i.year:省略某些变量和/或不给我标准误差,只显示系数(下面代码中的示例)
* Read file
import delimited using "datafile.csv", clear case(preserve)
* Run regression
mlogit DV1 IV1 IV2 IV3 IV4 IV5 IV1##IV2 i.year, base(0) iterate(1000)
xtmlogit
- 错误 - 不运行
- 错误信息:排列总数为 2,389,461,218;这么多排列需要大量内存,并且可能导致运行时间过长;无论如何都使用选项 force 继续,或考虑使用选项 rsample()
解决方案
固定效应和非线性模型(例如 logits)是一种尴尬的组合。在线性模型中,您可以简单地添加假人/贬低来摆脱特定于组的截距,但在非线性模型中,这些都不起作用。我的意思是你可以在技术上做到这一点(我认为这是 R 代码正在做的事情),但从概念上讲,它实际上是做什么的还不清楚。
计量经济学家在这方面花费了大量时间,这导致了一些变通方法,通常称为条件 logit。IIRC 这是在femlogit中实现的。我认为您的代码中的错误是您试图通过虚拟规范(i.year)包含固定效果。相反,您应该xtset您的数据,然后在没有假人的情况下运行femlogit。
xtset year
femlogit DV1 IV1 IV2 IV3 IV4 IV5 IV1##IV2
请注意,这些条件 logit 模型可能非常慢。就个人而言,我更喜欢运行两个一对一的线性回归(1=1 和 0/-1 设置为零,然后 -1=1 和 0/1 设置为零)。然而,意见分歧(伍德里奇似乎也是一个粉丝,许多其他人则不是)。
推荐阅读
- javascript - 如何在html表中的串行单元格中删除类
- java - 向 java.util.date 对象添加毫秒时的错误结果
- python - 收到此错误 RuntimeError: size mismatch, m1: [10 x 33], m2: [34 x 10]
- database - 如何更改 Open Client sybase 中的最大连接数
- android - 此类在 API 级别 R 中已弃用。 - 这是什么意思?
- java - 从 IntelliJ 的项目目录中删除 Maven 配置文件的其他模块
- opengl - phong 和 goraud 着色 - 需要有关片段如何着色的知识
- javascript - 提供查询参数时显示 404 的反应查询字符串
- html - 如何使用 CSS 在表格上应用边框间距
- asp.net-mvc - MVC 使用 EditorForModel 隐藏标签并显示占位符