r - 解释多元线性回归模型中的交互系数
问题描述
我正在努力解释交互模型中的系数。
我正在查看 2 个二进制(虚拟变量)的交互模型的结果。我只是想知道我如何解释:-拦截(一切都为0)?- 斜率系数?- 交互系数?
在标准多元线性回归中,当 x 有 1 个单位的变化时,我们谈论 y 的变化,其他一切都保持不变。我们如何在互动中解释这一点?特别是因为我的两个变量都是虚拟的?
希望这是有道理的,并提前非常感谢。
解决方案
我们如何在互动中解释这一点?
由于添加了交互项/项,具有交互作用的模型中回归系数的含义与没有交互作用的简单线性回归的情况不同。
回归系数不再表示平均响应随预测变量增加单位的变化而变化,而其他预测变量在任何给定水平上保持不变。这种解释只有在考虑了对其他预测变量水平的依赖性之后才有效。
前任:
具有交互项的 SLRM:
E(Y) = B0 + B1X1 + B2X2 + B3X1X2
解释:
可以证明,当 X2 保持不变时,平均响应随 X1 增加一个单位的变化为:
B1 + B3X2
并且,当 X1 保持不变时,平均响应随 X2 增加一个单位的变化是:
B2 + B3X1
我只是想知道我如何解释:-拦截(一切都为0)?
当所有预测变量都处于零水平时,截距是回归模型的预测。
斜率系数?在没有交互系数的情况下。
E(Y) = B0 + B1X1 + B2X2
系数 B1、B2 分别表示虚拟变量 X1、X2 的响应函数比两个虚拟变量都为零时的响应函数高(低)多少。因此,B1 和 B2 测量了虚拟变量对响应函数高度的不同影响,即 E(Y)。
您可以检查只有斜率发生变化:当 X1 = 1 且 X2 = 0 时。
E(Y) = B0 + B1
并且,当 X1 = 0 和 X2 + 1 时。
E(Y) = B0 + B2
交互系数?
通过交互系数,我了解具有交互作用的模型的回归系数。
该模型:
E(Y) = B0 + B1X1 + B2X2 + B3X1X2
当 X1 和 X2 都为 1 时,模型变为:
E(Y) = B0 + B1 + B2 + B3.
这转化为响应函数高度的增加或减少。
您可以使用第三个连续预测变量创建一个更有趣的示例,并探索连续变量与虚拟变量的交互关系,在这种情况下,回归的斜率也会发生变化,而不仅仅是截距。并且,因此,对于任何给定的 X1 和 X2 水平,一个响应函数比另一个响应函数高(低)多少的解释将是无效的,因为斜率也会改变,因此虚拟预测器的效果也将是更明显。
当存在交互效应时,可以通过比较模型范围内不同类别虚拟变量的回归函数来研究定性预测变量(虚拟变量)的影响。
参考资料:库特纳等。人。应用线性统计模型