首页 > 解决方案 > 如果存在主效应和交互效应,解释整体效应?

问题描述

假设,我有三个独立的分类变量 e、f 和 g,并且想估计因变量 y。经过一些工作,我得到了以下回归模型:

y =  b0 + b1*x + b2*y + b3*z + b4(xy) + b5(xz)

我如何确定不同类别/级别是否存在总体显着差异x?由于与b2b3是相等的,我认为它们可能可以忽略不计。

标签: regressionlinear-regressionanovainteractionsignificance

解决方案


据我了解,回归模型中的三个分类变量是 x、y 和 z。我将把 y 重写为 w,因为结果和变量都标记为 y。对于这篇文章,我指的是这个模型:

Y = b0 + b1x + b2 w + b3z + b4(x w ) + b5(xz)

您在三个级别(xw、xz 和 wz 作为参考)之间存在交互。

如果这是真的,那么你就不能断言x 对 w 的直接影响。为什么?因为这些列是共线的,所以对 b1、b2 和 b3 的估计是有偏差的。另一种思考方式是 x 的影响取决于 w(因此是相互作用)。

如果您想了解 x 对 Y 的直接影响(或 W 对 Y、z 对 Y 的直接影响),那么您可以拟合没有交互项的模型。IE 适合

Y = b0 + b1x + b2w + b3z

并查看 b1 上的意义。该模型表明 x 对 Y 的影响与 w 或 z 无关。

因为您提到 b2 和 b3 大致相同,所以我建议另一种方法。您可以将 w 和 z 变量折叠在一起(如果在科学上有意义的话)并拟合一个模型,其中只有 x 和合并的 wz 变量之间的交互项。

假设您需要交互项并希望传达 x 如何影响 y。然后,您可以选择有意义的协变量值并解释这如何改变结果。这种策略不再关注“意义”,而是将注意力转移到解释和意义上。例如,如果 x=1、w=0 和 z=0,则对 Y 的影响为 b1;如果 x=1、w=0、z=1 等,对 Y 的影响是 b1 + b3 + b5。


推荐阅读