【分享】调节效应检验,变量中心化的真相

您所在的位置:网站首页 共线性检验vif要做中介变量和调节变量吗 【分享】调节效应检验,变量中心化的真相

【分享】调节效应检验,变量中心化的真相

2024-07-11 13:26| 来源: 网络整理| 查看: 265

Papers4You二维码.jpg 2016-7-24 05:55:32 上传 下载附件 (40.62 KB)

本文首发于微信公众号:Papers4You,只发干货的平台,欢迎社科类研究者关注

在进行调节效应的检验时,我们一般会对自变量和调节变量进行中心化(Mean Centering),即分别减去各自的平均数,把中心化后的自变量和调节变量相乘,得到交乘项(调节效应项)。 那么问题来了:中心化的原因何在? A:如果直接带入回归方程,自变量、调节变量与交乘项会高度相关,造成多重共线性问题,回归系数的大小、显著性检验会受到影响。 B:中心化后的回归结果,有助于对方程进行解释。 C:A和B都对。 D:不清楚原因,我听别人说的。 你会选哪个答案? 其实,正确答案是B!!! Why? 首先,我们来看回归系数。下面的公式中,X为自变量,M为调节变量。X'和M'分别为中心化后的自变量和调节变量。 未中心化的回归方程是这样的: QQ截图20160723203723.png 2016-7-24 05:58:23 上传 下载附件 (3.71 KB) 由于X-自变量的平均数=X',M亦如此。所以 QQ截图20160723203822.png 2016-7-24 05:58:23 上传 下载附件 (6.14 KB) 拆开括号 QQ截图20160723204033.png 2016-7-24 05:58:23 上传 下载附件 (14.34 KB) 设C为常数部分,则可化简为 QQ截图20160723204535.png 2016-7-24 05:58:25 上传 下载附件 (5.52 KB) 从上面的变形可以看出, 中心化与未中心化的回归结果相比,交乘项的回归系数不会发生变化,截距、自变量、调节变量的回归系数则会发生变化。 然后,我们来看回归系数标准误(Standard Error)的计算。第j个回归系数的标准误公式如下 ad5a8864-89f7-4865-88e7-46ff466fef1d.png 2016-7-24 05:58:21 上传 下载附件 (9.5 KB) 其中,Rj方是变量j被其他预测变量所解释的百分比,换句话说,以第j个预测变量为因变量,以其他预测变量为自变量,进行回归分析,得到的R方,就是这个Rj方。MSresidual,则是回归方程的均方残差。n为样本量,sj方为变量j的方差。 其中,左边根号下的部分被称为方差膨胀因子或变异膨胀系数(Variance Inflation Factor,VIF)。一般来说,VIF>10,为危险程度的共线性(可能导致异常结果),VIF>5,为高共线性。所以标准误的公式可变为 ba311c7b-3fd0-46e4-b8ae-405395648667.png 2016-7-24 05:58:22 上传 下载附件 (8.66 KB) MSresidual和n不会因为中心化而改变。所以交乘项的标准误同时取决于VIF和它的方差。一般来说,中心化会使交乘项VIF的值变小,但它的方差同样会变小,且两者之比维持不变,所以交乘项的标准误也不变。由于交乘项的回归系数不因中心化而改变,所以其t值,p值不变,即中心化不影响交乘项回归系数的显著性检验。 以上两点说明,交乘项的回归系数大小及其显著性检验均不受中心化与否的影响。而进行调节效应的分析时,首先看的就是交乘项系数是否显著。如果显著,说明M会对X与Y之间的关系产生影响,具体的作用模式和边界条件等,则需要进一步的计算。 综上所述,中心化不能降低变量之间因共线性而导致的方程估计问题。如果你的数据因高度共线性而导致不可接受的结果,那么即使进行中心化,也于事无补。 既然中心化对调节效应是否存在没有影响,为何Aiken & West(1991),Cohen等(2003)建议我们进行中心化后再检验调节效应?原因在于对方程回归系数的解释。 进行调节效应分析的研究领域一般涉及到心理测量(态度,知觉,观念等),一般来说,这些变量取值为0是没有意义的。例如,未中心化的回归方程结果为 a231a0f8-8d25-4075-bbd4-cc05bdf8d12a.png 2016-7-24 05:58:21 上传 下载附件 (7.93 KB) X的系数应该这样理解:当调节变量M为0时,X每增加1,Y减少3.773。然而,M为0一般不具备现实意义,因为人类都或多或少地持有某种态度或观念,而且量表一般也不包括0值(少部分问卷,如,价值观问卷,会包含0值,也会被赋予一定的现实意义,此类问卷要区别对待。)。与之相对,如果此方程是中心化后的结果,X的系数应该这样理解:当调节变量M取均值(处于中等程度)时,X每增加1,Y减少3.773(此处为举例方便,实际上,中心化后的X系数会发生改变,详见前文方程推导)。这样,回归系数就具备了现实意义。 现在,你了解调节效应的检验过程中,变量中心化的原因了吗? Notes 在论文的实证检验部分,请这样描述:“根据Aiken & West(1991)、Cohen等(2003)、Hayes(2013)的建议,为使回归方程的系数更具解释意义,本文对变量进行中心化并计算出调节作用项……”。不要这样描述:“根据Aiken & West(1991)、Cohen等(2003)、Hayes(2013)的建议,为了避免变量之间多重共线性导致的消极影响,本文对变量进行中心化并计算出调节作用项……”。也就是说,避免多重共线性不能作为中心化的理由。以上给出的三条参考文献可以只引用其中几条。 学界对正确使用中心化的呼吁由来已久,如果想参考本文的观点对“避免多重共线性不能作为中心化的理由”进行论述,可以引用较新的Hayes(2013)为依据。

References

Aiken, L. S., & West, S. G. (1991). Multiple regression: Testing and interpreting interactions. Thousand Oaks, CA: Sage Publications. Cohen, J., Cohen, P., West, S. G., & Aiken, L. S. (2003). Applied multiple regression and correlation for the behavioral sciences (3rd ed.). Mahwah, NJ: Lawrence Erlbaum Associates. Hayes, A. F. (2013). Introduction to mediation, moderation, and conditional process analysis: A regression-based approach. Guilford Press.


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3