深入解析交互效应、主效应和简单效应

您所在的位置:网站首页 简单效应分析什么意思 深入解析交互效应、主效应和简单效应

深入解析交互效应、主效应和简单效应

2024-07-12 11:10| 来源: 网络整理| 查看: 265

所谓“事出反常必有妖,事由多因必复杂”。对于多因素研究,不仅要关注每个因素的直接效应,还需要考虑因素与因素之间的相互作用。交互作用由于其实际的生物学和专业意义,越来越受到研究者的重视。但由于现实世界事物间联系本身的复杂性,很难穷尽“真实”交互作用的所有形式,目前研究者仍然主要从数据出发,依靠统计学方法进行交互作用的识别,此时称为统计学交互作用(statistical interaction)更为合理。常用的方法包括分层(或亚组)分析后效应的异质性检验、模型中纳入乘积交互项等。同时,根据交互作用的发生机制、模型、效应指标不同,可以分为相加模型和相乘模型两种,其原理各位看官可以查阅相关文献哦。在我们下面的案例中,由于是基于线性模型,通过差值考察效应,实际考察的仅是相加交互作用。

一、研究效应

研究效应是研究因素作用下研究对象出现的反应或结果。但从归因的角度来看,不管是多因素研究还是单因素研究,观察到的结果都是多种因素作用产生的综合效应。比如100人用某药后80人有效,有效率80%是综合有效率,需要设置一个不用药且可比对照组,如观察到对照组有效率为60%,实际归因于药物的有效率为20%。因此,研究中归因效应都是通过差异(差或比的形式)体现的。在单因素分析中比较简单,但在多因素分析中,还需要区分主效应、简单效应和交互效应。

(一)主效应

主效应是不考虑其他因素存在时,所关注因素不同水平观察结果的差异。比如上例中的20%即为药物的主效应。

(二)简单效应(单独效应)

简单效应又称单独效应,是指其他因素水平固定时,所关注因素不同水平的效应之差。比如对于重型病人归因于药物有效率为10%(即重型病人用药组有效率65%-对照组55%)。因此简单效应反映的不是所有对象的估计结果,而是某一亚组(如对照组、第1周等)的估计结果。

(三)交互效应

两个或多个因素间的效应互不独立的情形,即一个因素的单独效应随着另外一个(或多个)因素水平的变化而变化。比如重型病人归因于药物有效率为10%(即重型病人用药组有效率65%-对照组55%),而轻型病人有效率为30%(即轻型病人用药组有效率95%-对照组65%),此时即可认为存在了药物与病型存在交互作用。

药物有效率研究中的交互效应

二、案例-两分类变量效应解读

示例:三组实验(正常、实验A、实验B)治疗某病的效果,进行了21周的随访,随访时点位3、7、14、21周四个时点;Y表示测量指标。

grp:组别。

t:随访时间。

y:测量结果(因变量)。

考虑本研究为重复测量设计,估采用线性混合效应模型(为方便演示,纳入随机效应为随机截距)。

ods html dpi=300 ;

ods graphics / reset height=5in width=7in noborder attrpriority=color ;

proc sgplot data = t;

   styleattrs    datacontrastcolors=("#ff5500" "#4b71af" "#54a767" "#7f72b2" "#d98ac2" "#ccb874" "#ff6b83" "#da8455" "#90b0ed") ;

   vline t /  group=grp response=y stat=mean limits=both limitstat=stddev markers LIMITATTRS=(thickness=1px )

       CLUSTERWIDTH=0.5 datalabel    GROUPDISPLAY=CLUSTER lineattrs=(thickness=3px ) name="a";

   xaxis display=(nolabel)

       valueattrs=(size=9 Family="黑体/Times New Roman" weight=bold)

        labelattrs=(size=10 Family="黑体/Times New Roman" weight=bold)  grid GRIDATTRS=(color=white thickness=1.5) ;

   yaxis  

       valueattrs=(size=9 Family="黑体/Times New Roman" weight=bold)

       label="Y"

        labelattrs=(size=10 Family="黑体/Times New Roman" weight=bold)   grid GRIDATTRS=(color=white thickness=1.5) ;

   keylegend "a"/ title="组别" titleATTRS=( Family="黑体/Times New Roman" size=8 weight=bold) noborder

       VALUEATTRS=( Family="黑体/Times New Roman" size=8 weight=bold) location=inside position=topright down=4;

       format t t. grp grp.;

run;

ods graphics off;

proc means data =t n nmiss mean ;

   var y;

   class grp t;

   format t t. grp grp.;

run;

(二)模型建立1、 建立主效应模型

模型中不纳入交互作用的时,结果即为主效应。

代码:

proc mixed data = t covtest;

  class id grp(ref="1正常") t(ref="3周") /ref=first;

  model y=t grp / solution;

  random int / subject=id type=un solution g ;

  lsmeans t grp /cl diff;

run;

quit;

结果:

(1)模型的固定效应参数估计结果

上图为固定效应的解,模型中没有纳入交互效应,呈现为主效应结果。主效应是基于所有人不分组的结果,此时假设三组随时间的变化趋势线平行。grp结果显示:实验组A与正常组相比,结果低于正常组(实验组A-正常组=-2.4586)。同理,14周和21周结果低于3周结果。

(2)模型的最小二乘均值

上图结果输出模型中组别和时间的最小二乘均值,我们可以发现组间最小二乘均值的差即为模型的系数估计。例如:实验组A-正常组=1.7491-4.2080=2.4589。该结果与上述结果一致。

(3)不同组别的均值

那么我们继续输出均值的结果呢?

proc means data =t n nmiss mean stddev ;

  var y;

  class t ;

  format t t. ;

run;

不同组别的均值结果表明:实验组A-正常组=1.74907-4.20798=-4.4589。此时,我们惊奇地发现,不同组别描述的均值之差和最小二乘均值之差相同,那么这种情况是巧合吗?

在一般情况下,若数据是均衡的,二者的主效应计算结果就是相同;但如果数据不均衡,二者的结果也会不一样。本研究中各测量时点相同,且不存在缺失,可认为是均衡数据。从使用的角度看,若试验是不均衡的,则应该使用LSMEANS。此外,LSMEANS也用于某个因素下水平间差异的检验。小编这里建议大家直接使用LSMEANS。

2、模型的交互效应和简单效应

模型中纳入交互作用的时,结果即为交互效应和简单效应。

代码:

ods output diffs=diffs;

proc mixed data = t covtest;

  class id grp(ref="1正常") t(ref="3周") /ref=first;

  model y=t grp t*grp/ solution;

  random int / subject=id type=un solution g ;

  lsmeans t grp t*grp/cl diff;

run;

quit;

结果:

3、简单效应的理解和结果解释:

图中结果表明:时间以“3周”为参照组,组别以“正常”为参照组的情况下,实验组A和正常组比较的估计值为-2.1715,此时的结果即为简单效应,解释为:固定时间=3周时,实验组A与正常组的差值估计。听到这里的小伙伴可能会产生困惑,难道我之前的效应解释都错了??那让我慢慢道来。首先,通过“lsmeans t grp t*grp/cl diff语句”输出每个分类变量和其交互项的最小二乘均值:

模型输出结果较长,我们通过提取Excel表格,经过筛选结果如下:

结果表明:在控制时间=3周的情况下,实验组A和正常组比较的最小二乘均值的差值为-2.1715。

现在我们再理解下简单效应的概念“其他因素水平固定时,同一因素不同水平的效应之差”。是不是豁然开朗!!!同理,由于本研究为均衡数据,此时控制时间=3周时,实验组A和正常组均值比较的结果仍为-2.1715。

4、交互效应的理解和结果解释:

交互结果表明:14周时实验组B与正常组的差值与3周时实验组B与正常组的差值的差值为-1.2483。那么怎么理解这个结果呢?首先,我们得到14周时实验组B与正常组的差值为-1.6624(该结果为组别在时间=14周时的单独效应)。

同理得到3周时实验组B与正常组的差值为-0.4141(该结果为组别在时间=3周时的单独效应)。

那么差值的差值为:-1.6624-(-0.4141)=-1.2483。此刻再理解交互效应的概率“两个或多个因素间的效应互不独立的情形,表示一个因素的单独效应随着另外一个因素水平的变化而变化”,组别在14周的单独效应和组别在3周时的单独效应之差。

现在,可否豁然开朗?

继续!!!

三、案例-1分类1定量变量结果解读

直接上代码:

ods results;

ods output solutionf=EST_bl_y;

proc mixed data=dataset_bl plots=studentpanel(marginal conditional);

  class x(ref="2");

  model y=x logCRP x*logCRP/solution cl;

  lsmeans x/ cl diff;

run;

quit;

其中:

X:定性资料

logCRP:定量资料

y:因变量

此时的Mixed过程步,没有纳入随机效应,结果同线性回归模型结果。

(一)交互效应的理解和结果解释:

结果显示:logCRP和x存在交互效应。定性资料和定量资料的交互可以理解为:通过定性资料分层,分别拟合模型,模型的系数差,即为交互结果。X分为0 1 2三层分别拟合线性回归模型如下:

此时,我们用X=0时的回归系数减去X=1时的回归系数:0.178-1.275=-1.097。刚好等于模型的估计系数。

那么,是否还有更直观的解释?我们通过绘制不同X分层的回归拟合图,图中的斜率即为X分层建模logCRP的系数。我们发现X=0和X=1具有相同的变化趋势,而X=0、X=1与X=2变化趋势存在交叉,也对应的模型的结果,交互效应具有统计学意义。此时模型还可以解释为:随着logCRP的增加,X=2时具有较快的增长趋势,而X=0和X=1具有相同的增长趋势。听到这里?还不点赞、收藏和转发??

需要数据和代码的小伙伴私信小编发送“交互”!!!

关注微信公众号,获取更多相关内容!



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3