【分享】调节效应检验，变量中心化的真相

您所在的位置：网站首页 › 共线性检验vif要做中介变量和调节变量吗 › 【分享】调节效应检验，变量中心化的真相

【分享】调节效应检验，变量中心化的真相

2024-07-11 13:26| 来源: 网络整理| 查看: 265

Papers4You二维码.jpg 2016-7-24 05:55:32 上传下载附件 (40.62 KB)

本文首发于微信公众号：Papers4You，只发干货的平台，欢迎社科类研究者关注

在进行调节效应的检验时，我们一般会对自变量和调节变量进行中心化（Mean Centering），即分别减去各自的平均数，把中心化后的自变量和调节变量相乘，得到交乘项（调节效应项）。那么问题来了：中心化的原因何在？ A：如果直接带入回归方程，自变量、调节变量与交乘项会高度相关，造成多重共线性问题，回归系数的大小、显著性检验会受到影响。 B：中心化后的回归结果，有助于对方程进行解释。 C：A和B都对。 D：不清楚原因，我听别人说的。你会选哪个答案？其实，正确答案是B！！！ Why? 首先，我们来看回归系数。下面的公式中，X为自变量，M为调节变量。X'和M'分别为中心化后的自变量和调节变量。未中心化的回归方程是这样的： QQ截图20160723203723.png 2016-7-24 05:58:23 上传下载附件 (3.71 KB) 由于X-自变量的平均数=X'，M亦如此。所以 QQ截图20160723203822.png 2016-7-24 05:58:23 上传下载附件 (6.14 KB) 拆开括号 QQ截图20160723204033.png 2016-7-24 05:58:23 上传下载附件 (14.34 KB) 设C为常数部分，则可化简为 QQ截图20160723204535.png 2016-7-24 05:58:25 上传下载附件 (5.52 KB) 从上面的变形可以看出，中心化与未中心化的回归结果相比，交乘项的回归系数不会发生变化，截距、自变量、调节变量的回归系数则会发生变化。然后，我们来看回归系数标准误（Standard Error）的计算。第j个回归系数的标准误公式如下 2016-7-24 05:58:21 上传下载附件 (9.5 KB) 其中，Rj方是变量j被其他预测变量所解释的百分比，换句话说，以第j个预测变量为因变量，以其他预测变量为自变量，进行回归分析，得到的R方，就是这个Rj方。MSresidual，则是回归方程的均方残差。n为样本量，sj方为变量j的方差。其中，左边根号下的部分被称为方差膨胀因子或变异膨胀系数（Variance Inflation Factor，VIF）。一般来说，VIF>10，为危险程度的共线性（可能导致异常结果），VIF>5，为高共线性。所以标准误的公式可变为 2016-7-24 05:58:22 上传下载附件 (8.66 KB) MSresidual和n不会因为中心化而改变。所以交乘项的标准误同时取决于VIF和它的方差。一般来说，中心化会使交乘项VIF的值变小，但它的方差同样会变小，且两者之比维持不变，所以交乘项的标准误也不变。由于交乘项的回归系数不因中心化而改变，所以其t值，p值不变，即中心化不影响交乘项回归系数的显著性检验。以上两点说明，交乘项的回归系数大小及其显著性检验均不受中心化与否的影响。而进行调节效应的分析时，首先看的就是交乘项系数是否显著。如果显著，说明M会对X与Y之间的关系产生影响，具体的作用模式和边界条件等，则需要进一步的计算。综上所述，中心化不能降低变量之间因共线性而导致的方程估计问题。如果你的数据因高度共线性而导致不可接受的结果，那么即使进行中心化，也于事无补。既然中心化对调节效应是否存在没有影响，为何Aiken & West（1991），Cohen等（2003）建议我们进行中心化后再检验调节效应？原因在于对方程回归系数的解释。进行调节效应分析的研究领域一般涉及到心理测量（态度，知觉，观念等），一般来说，这些变量取值为0是没有意义的。例如，未中心化的回归方程结果为 2016-7-24 05:58:21 上传下载附件 (7.93 KB) X的系数应该这样理解：当调节变量M为0时，X每增加1，Y减少3.773。然而，M为0一般不具备现实意义，因为人类都或多或少地持有某种态度或观念，而且量表一般也不包括0值（少部分问卷，如，价值观问卷，会包含0值，也会被赋予一定的现实意义，此类问卷要区别对待。）。与之相对，如果此方程是中心化后的结果，X的系数应该这样理解：当调节变量M取均值（处于中等程度）时，X每增加1，Y减少3.773（此处为举例方便，实际上，中心化后的X系数会发生改变，详见前文方程推导）。这样，回归系数就具备了现实意义。现在，你了解调节效应的检验过程中，变量中心化的原因了吗？ Notes 在论文的实证检验部分，请这样描述：“根据Aiken & West（1991）、Cohen等（2003）、Hayes（2013）的建议，为使回归方程的系数更具解释意义，本文对变量进行中心化并计算出调节作用项……”。不要这样描述：“根据Aiken & West（1991）、Cohen等（2003）、Hayes（2013）的建议，为了避免变量之间多重共线性导致的消极影响，本文对变量进行中心化并计算出调节作用项……”。也就是说，避免多重共线性不能作为中心化的理由。以上给出的三条参考文献可以只引用其中几条。学界对正确使用中心化的呼吁由来已久，如果想参考本文的观点对“避免多重共线性不能作为中心化的理由”进行论述，可以引用较新的Hayes（2013）为依据。

References

Aiken, L. S., & West, S. G. (1991). Multiple regression: Testing and interpreting interactions. Thousand Oaks, CA: Sage Publications. Cohen, J., Cohen, P., West, S. G., & Aiken, L. S. (2003). Applied multiple regression and correlation for the behavioral sciences (3rd ed.). Mahwah, NJ: Lawrence Erlbaum Associates. Hayes, A. F. (2013). Introduction to mediation, moderation, and conditional process analysis: A regression-based approach. Guilford Press.

【本文地址】

【分享】调节效应检验，变量中心化的真相

【分享】调节效应检验，变量中心化的真相

今日新闻

推荐新闻