R数据分析：二分类因变量的混合效应，多水平logistics模型介绍

您所在的位置：网站首页 › 混合效应模型和混合线性模型一样吗 › R数据分析：二分类因变量的混合效应，多水平logistics模型介绍

R数据分析：二分类因变量的混合效应，多水平logistics模型介绍

2024-06-19 08:25| 来源: 网络整理| 查看: 265

今天给大家写广义混合效应模型Generalised Linear Random Intercept Model的第一部分，混合效应logistics回归模型，这个和线性混合效应模型一样也有好几个叫法：

Mixed Effects Logistic Regression is sometimes also called Repeated Measures Logistic Regression, Multilevel Logistic Regression and Multilevel Binary Logistic Regression .

之后如果你遇到重复测量logistics回归，多水平logistics回归，你就应该知道他们都是指的是混合效应logistics回归模型这一个东西。

模型介绍

重复测量和嵌套数据是科研中很常见的，此时需要考虑多水平模型来更好地分解变异，因变量是二分类变量的时候我们会用logistics回归，多水平模型和logistics模型两个一结合就是非常经典的广义线性混合模型之一-----------多水平logistics回归。

就是这么简单。

为了更好地帮助大家理解，我们先回顾一下混合效应的一般写法，以随机截距为例子，当我们的因变量是连续的，此时我们可以做混合效应模型，比如我们的随机截距混合效应模型就是如下，其中uj就叫做随机截距（去翻翻之前的文章哈）：

再扩展一下，当我们的因变量Y不是正态分布的时候，我们就有广义线性随机效应模型如下：

多了一个链接函数link funtion，其余都一样的。这个链接函数可以是logit，可以是probit等等。

那么具体到因变量是二分类的时候我们就要用logit链接函数了。

此时我们的混合logistics模型的图示如下：

左上角就是大家都知道的logistics回归模型，右上角是随机截距logistics模型，左下角是随机斜率logistics回归模型，右下角就是既有随机截距又有随机斜率的logistics模型啦，和之前给大家写的线性混合模型一模一样的。

然后对于这么一个随机截距模型，我们有固定效应部分的系数如下表：

其中β0就是截距，是x取0的时候y取1的log-odds（看不明白log-odds的同学去瞅瞅logistics机器学习的文章哈），β1是在控制了其余变量的情况下x每增长一个单位，log-odds的增长量；我们要报告的expβ1，这个就是odds ratio，就是论文中常见的风险相对于参考组增加多少多少倍的意思。

我们还有随机效应部分的系数：