重复测量数据分析系列：广义线性混合模型（GLMM）

您所在的位置：网站首页 › 重复测量混合线性模型spss › 重复测量数据分析系列：广义线性混合模型（GLMM）

重复测量数据分析系列：广义线性混合模型（GLMM）

2023-09-17 05:41| 来源: 网络整理| 查看: 265

广义线性混合模型（GLMM）可以看做是广义线性模型和线性混合模型的融合，可以处理不呈正态也不独立的数据。

示例：某溶栓药物治疗20名急性脑梗死患者的疗效，采用随机、双盲、安慰剂平行对照设计，每组各10例，分别于治疗前及治疗后8周每周进行随访观测，观测指标为神经系统体征评分（MDNS）。示例来源：杨珉.李晓松等.医学和公共卫生研究常用多水平统计模型.北京:北京大学医学出版社,2007.5.

此次笔记只是演示广义线性混合效应模型在重复测量数据上的操作步骤，并不是一个完整的案例分析。示例一开始便建立完整的“全模型”，残差方差协方差结构则设定为不同时间点的纵向资料分析常见的一阶自回归，然后逐渐去除掉没有意义的因素。

用广义线性混合模型来分析这个连续型数据的重复测量的示例，本质上就是用广义线性混合模型（GLMM）来实现多层线性混合模型（LMM）而已。为了更好地理解模型参数代表的意义，我们先重新温习一下多层线性混合模型，本例全模型如下：

加入背景协变量age后，结果会有校正。在组合模型里面，截距γ00是Trtgj=0、ageij=0、timeij=0时结局测量MDNS的平均得分值。这里要特别强调一下“变量取值=0”：在向模型中添加变量时，我们往往把分类变量作为因子(Factor)纳入，而连续变量作为协变量(Covariate)纳入。如果把分类变量作为协变量纳入，则会按连续变量处理，取值为分类变量各水平的赋值，同样如果把连续变量作为因子进行分析，则会把连续变量的取值作为其各个水平的赋值。对于按协变量纳入模型的变量而言，变量取值为0和赋值为0是一致的，如本例中的age和time，age=0表示年龄为0岁，time=0表示治疗前。但是对按因子纳入模型的而言，这里的“初始水平”或者说“取值=0的变量水平”指的是变量被设为参照的那个水平，STATA默认低水平为参照水平而且可以指定任意水平为参照，而SPSS一般默认高水平为参照水平，在广义模型里可以通过顺序排序进行调整，如本例的Trtg，在[构建选项]选项卡中分类预测因子默认是按升序排列的，其取值为0的水平表示Trtg=1（治疗组），γ00就是年龄为0岁(age=0)的治疗组(Trtg=1)的研究对象在治疗前(time=0)的MDNS均值，本例改为按降序排列，其取值为0的水平便表示Trtg=0（对照组），截距γ00是Trtgj=0、ageij=0、timeij=0时结局测量MDNS的平均得分值即年龄为0岁的对照组的研究对象在治疗前的MDNS均值，相应的γ01则是治疗组(Trtgj=1)与对照组（Trtgj=0）的年龄为0的研究对象在治疗前(time=0)MDNS的平均差异。在当前模型中我们假定变量age对结局测量MDNS的影响不随时间变化而变化，即对截距可能产生影响而对time的斜率无影响，γ10是对照组(Trtgj=0)研究对象的MDNS平均变化率，γ11则是治疗组(Trtgj=1)与对照组(Trtgj=0)的MDNS的平均变化率差异。

还有一个问题需要注意，对当前模型而言，连续变量age采用的是原始值，age=0是不存在的，所以截距并没有实际意义，因此一般来说连续型变量需要进行中心化处理，中心化处理之后截距γ00代表的就是age取均值时对照组的研究对象在治疗前的MDNS均值，限于篇幅本示例仅演示广义线性混合模型的操作，并没有age中心化的处理。

对于治疗主效应（模型系数），也需要特别说明一下，这关系到结果的正确解读。在临床研究中，多数研究会采用各种方法（如随机化）让基线值无统计学差异，而且基线值常常是在干预之前，此时干预组和对照组都都没有被施加干预因此两组常常无差异。而模型中干预因素系数实际上是初始水平(time=0)的组间差异，个人理解就是用time=0时的单独效应（上图中的γ01：治疗组(Trtgj=1)与对照组（Trtgj=0）的研究对象在治疗前(time=0)MDNS的平均差异），用其来代表干预因素除去交互作用后的效应。所以如果发现固定效应的检测结果治疗因素无统计学意义不要失望，而是应该欣喜。既然基线差异并不能代表干预的效果，我们可以将治疗终点设为参照水平，用治疗结束时治疗组和对照组之间的差异来代表治疗效应，或许这就是为何SPSS默认高水平为参照水平的原因了。当然这个参照水平我们可以修改，一是利用广义混合线性模型[模型选项]中改变显示估计均值的连续变量值，二是直接修改时间的取值，对时间尺度进行重新编码。当然如果时间是按分类变量纳入，默认的就是高水平为参照水平，这个也可以通过广义线性混合模型[构建选项]里面的顺序排序来修改。

操作步骤：

【1】数据录入：具体略。

【2】广义混合线性模型：分析>>混合模型>>广义线性…

①数据结构：将变量id拖到[主体Subjects]上，将变量time拖到[重复测量]；点击更多，重复协方差类型选择一阶自回归。

②字段和效应

目标：选择因变量MDNS。线性模型的目标分布与关系部分（图中红框部分）可以选择不同的数据类型，可以扩展到正态分布以外的数据类型。

固定效应：将变量age、Trtg、time拖到[主(效应)]上，同时选中变量Trtg和time，拖到[双向]上;

随机效应：点击[添加块]打开随机效应块对话框；将变量time拖到[主要]列表框上，此步是建立变量time的随机斜率，即每个个体的MDNS随时间的变化率不同；选中复选框[包含截距]，主体组合选入变量id，随机效应协方差类型使用默认的方差成分，此步是将变量id设为随机变异的来源，即设定截距在不同的个体间是不同的。同时设定随机截距和随机斜率的协方差结构。

③构建选项：分类变量预测因子按降序排列。本例之所以如此，是因为SPSS默认自变量高水平为参照水平，本例安慰剂和治疗组分别赋值0和1，结果是与治疗组相比，安慰剂如何如何。从逻辑上我们想知道，治疗组比安慰剂组有没有改善，即以安慰剂为参照水平，按降序排列后会达到这个效果。另外自由度的估算方法、固定效应及系数检验方法不同，结果可能会有些微的差别。

④模型选项：可以对分类变量进行边际均数比较。本例Trtg选中成对比较，比较治疗结束时(time=8)采用age均值进行校正的结果，多重比较采用默认的LSD法。

如此处设置age=0，time=0，则会得到固定效应系数检验完全一致的结果。如想更好地理解，可参见前面对多层线性混合模型的释义。

【3】结果解读：结果显示基本的个案处理信息和结果缩略图，可以双击缩略图进入模型浏览器查看详细内容。

①模型概要：输出因变量，概率分布，链接函数及信息准则。在纳入不同数量的自变量或选择不同的方差-协方差结构时，可通过信息准则来判定更优的模型。

②数据结构：列出模型的层次结构。本例高层级有20个水平，每个水平重复观测9次。

③预测值和实测值的散点图：可见预测值和实测值存在较好的正向相关，模型拟合良好。

④固定效应检验：默认以图形样式给出各因素的参数关联强度，粗线表示有统计学意义（P0.05），至少有一个变量的系数不为0。

ii）年龄age的主效应无统计学意义（F=2.684，P=0.103>0.05），对整个模型的不产生影响。iii）变量Trtg主效应无统计学意义（F=0.187，P

【本文地址】

重复测量数据分析系列：广义线性混合模型（GLMM）

重复测量数据分析系列：广义线性混合模型（GLMM）

今日新闻

推荐新闻