stata - Stata 中 Sergio Corriea 的 ppmlhdfe 命令的负二项式替代方案
问题描述
我正在与一位同事使用美国人口普查中的个人微观数据(2015-2019 ACS 5 年估计)撰写一篇论文。我们在控制各种协变量的同时预测个人的工资。协变量之一是个人居住的状态美洲狮。这成为一个问题,因为全国有超过 2,000 只不同的州美洲狮。由于我们只对控制状态 puma 感兴趣,我们可以使用areg
命令,它运行相对较快。然而,由于我们对报告个人工资的准确估计特别感兴趣以支持我们的论点,因此我们不能依赖于因变量的反对数。相反,为了获得准确的估计,我们应该使用泊松回归。但由于工资存在显着的过度分散,我们实际上需要使用负二项式回归。我们遇到了问题,因为数据集非常大(约 400 万个观测值)并且状态 puma 变量上有大量类别。有时它不会收敛。
我的同事和我想知道在 Stata 中是否存在与 Sergio Corriea 的ppmlhdfe
命令对应的负二项式?此命令使用伪似然过程而不是最大似然来显着加快分析速度。正如我所说,我们认为我们不能将它用于我们的分析,因为我们的因变量是过度分散的,因此需要一个额外的参数来充分模拟过度分散。
解决方案
推荐阅读
- azure - 在返回 ServiceBus 消息的 Azure 函数中,如何有条件地返回消息?
- php - Get_Header 在主页 Wordpress 上不起作用 - 几乎所有东西都试过了
- r - R中多列的条件均值?
- google-tag-manager - 通过 Google 跟踪代码管理器跟踪 Pardot 表单提交
- python - 从 python 中的 factor_analysisr 计算拟合优度和 rmsea
- php - 异常“无法在 BinaryFileResponse 实例上设置内容。” 仅在生产服务器上抛出
- php - 我在解析 php sdk 时遇到问题
- r - GGtext 跟随 group_split 和 map
- pyspark - 如何计算 PySpark 数据框列中字符串的出现次数?
- python - Visual Studio Code 没有为 numpy 正确实现 IntelliSense,但适用于所有其他模块 [内部图片]