首页 > 解决方案 > 如何找出分位数回归中不同分位数的系数是否显着不同?(SPSS 或 Python)

问题描述

我正在研究某个职业的收入增长率在收入分配的不同部分是否存在显着差异,以查看收入差距是否在显着扩大或缩小。

QUANTREG 模型

我在 SPSS 中执行了分位数回归(我是编码新手,只有 Python 的基本知识,所以我需要你的帮助)。因变量是指数收入,自变量是时间(该数据集中的季度)、人口统计组、专业领域。我还添加了每个虚拟人的交互项和时间变量。

所以(至少在我看来),这个模型允许在三个层次上比较收入的变化:

  1. 属于某个人口群体或细分市场如何影响收入(例如,与数据输入工作相比:数据分析增加 100 欧元,数据科学增加 200 欧元)
  2. 每个不同类别/虚拟对象的影响如何随时间变化(例如,与数据输入工作相比,成为数据科学家的积极影响增加了 10%,现在增加了 220 欧元)
  3. 这些变化的影响在收入分配的不同部分之间有何不同(例如,time*data_scientist 的系数在 90%Q 中比在 10%Q 中大得多,表明收入较高的数据科学家看到了更大的增长随着时间的推移,收入低于收入较低的数据科学家)

问题

所以我在 SPSS 上得到了这个分位数回归的输出,这是一个包含所有系数及其显着性和置信区间的巨大表格。

现在我想弄清楚90%Q和10%Q之间的差异在统计上是否显着,以便说明这个行业的收入差距是显着增加还是减少。我想在 Python 而不是 SPSS 上执行此操作,我搜索了如何将数据切割成分位数,以及如何执行分位数回归。但是应该如何测试 90%Q 和 10%Q 之间差异的显着性呢?

标签: pythonspsssignificancequantile-regression

解决方案


我找到了一种测试回归系数是否显着不同的方法,即使用标准化 β 权重的50% 规则及其 95% 置信区间(可以通过偏差校正引导程序估计;对于分位数回归,它们通常已经在输出)。该规则基本上规定,如果两个样本均值的 95% 置信区间的重叠小于 50%,则存在显着差异 (p=0.05)。在小于 14% 的重叠的情况下,显着性水平为 p=0.01。

这是我在其中找到此方法的 Youtube 视频:

https://www.youtube.com/watch?v=qKnpiGwNDMk

Youtube视频提到的论文:

卡明,G.(2009 年)。肉眼推断:读取置信区间的重叠。医学统计,28 (2), 205-220。


推荐阅读