python - 如何找出分位数回归中不同分位数的系数是否显着不同?(SPSS 或 Python)
问题描述
我正在研究某个职业的收入增长率在收入分配的不同部分是否存在显着差异,以查看收入差距是否在显着扩大或缩小。
QUANTREG 模型
我在 SPSS 中执行了分位数回归(我是编码新手,只有 Python 的基本知识,所以我需要你的帮助)。因变量是指数收入,自变量是时间(该数据集中的季度)、人口统计组、专业领域。我还添加了每个虚拟人的交互项和时间变量。
所以(至少在我看来),这个模型允许在三个层次上比较收入的变化:
- 属于某个人口群体或细分市场如何影响收入(例如,与数据输入工作相比:数据分析增加 100 欧元,数据科学增加 200 欧元)
- 每个不同类别/虚拟对象的影响如何随时间变化(例如,与数据输入工作相比,成为数据科学家的积极影响增加了 10%,现在增加了 220 欧元)
- 这些变化的影响在收入分配的不同部分之间有何不同(例如,time*data_scientist 的系数在 90%Q 中比在 10%Q 中大得多,表明收入较高的数据科学家看到了更大的增长随着时间的推移,收入低于收入较低的数据科学家)
问题
所以我在 SPSS 上得到了这个分位数回归的输出,这是一个包含所有系数及其显着性和置信区间的巨大表格。
现在我想弄清楚90%Q和10%Q之间的差异在统计上是否显着,以便说明这个行业的收入差距是显着增加还是减少。我想在 Python 而不是 SPSS 上执行此操作,我搜索了如何将数据切割成分位数,以及如何执行分位数回归。但是应该如何测试 90%Q 和 10%Q 之间差异的显着性呢?
解决方案
我找到了一种测试回归系数是否显着不同的方法,即使用标准化 β 权重的50% 规则及其 95% 置信区间(可以通过偏差校正引导程序估计;对于分位数回归,它们通常已经在输出)。该规则基本上规定,如果两个样本均值的 95% 置信区间的重叠小于 50%,则存在显着差异 (p=0.05)。在小于 14% 的重叠的情况下,显着性水平为 p=0.01。
这是我在其中找到此方法的 Youtube 视频:
https://www.youtube.com/watch?v=qKnpiGwNDMk
Youtube视频提到的论文:
卡明,G.(2009 年)。肉眼推断:读取置信区间的重叠。医学统计,28 (2), 205-220。
推荐阅读
- node.js - 使用 Google Sheets API 将 URL 写入不带引号的单元格
- django - 在 django 的同一视图中使用多个按钮
- reactjs - 在 Netlify 中构建时如何修复尝试导入错误?
- android - “被信号 5 中断:SIGTRAP”Android 模拟器 - macos
- c# - Migradoc - 标题出现在标题后附加的文本
- c - 在 C 中计算 Pi 的函数
- html - *ngFor 引发错误,其次图像未调整大小
- node.js - 当服务器托管在特定路径中时,无法从 node.js 获取 POST 请求
- cognos - Cognos Analytics - 将每周报告保存到本地驱动器
- elasticsearch - 弹性搜索放置模板。[mapper_parsing_exception] 根映射定义具有不受支持的参数