7.常用统计分析方法

您所在的位置:网站首页 病例对照研究分类标准是 7.常用统计分析方法

7.常用统计分析方法

2024-07-13 23:55| 来源: 网络整理| 查看: 265

目录

Logistic回归模型

基础概念

logistic回归分析基本步骤:

二分类Logistic回归

无序多分类Logistic回归

表格数据的Logistic回归

有序多分类Logistic回归

条件logistic回归

前一章介绍了多重线性回归模型,该模型中的因变量Y是定量变量,且给定自变量时,需要服从正态分布。如果需要分析的因变量为分类变量,如复发与未复发、生存和死亡、疗效、肿瘤组织的类型等,logistic回归就是分析该类因变量与自变量关系的方法。

Logistic回归模型 基础概念

logistic回归属于概率型非线性回归

与直线回归的区别:

        线性回归的因变量y是连续性数值型变量,不能是分类变量。logistic回归是研究二分类、多分类、有序多分类(等级资料)观察结果(因变量)与一些影响因素(自变量)之间的关系。如因变量:食管癌发生,一个二分类变量;自变量:吸烟、饮酒、不良饮食习惯等危险因素

logistic回归模型的线性形式:ln(P/(1-P))=logitP=β0+β1X1+...+βnXn

基本原理:

如果只研究一个影响因素,可以使用前面介绍的\chi ^{2}检验,如果研究多个因素影响,可以使用Mantel-Haenszel分层分析方法,用于校正多个混杂因素,但该方法存在一定的缺陷,无法描述混杂因素作用大小及方向,无法研究混杂因素之间的交互作用,其次该方法要求大样本,可分析因素少,混杂因素的增多,会发哦之分层变细,分析困难。

因变量Y为二分类变量,取值为0或1时,Y取值为1时通常为阳性结果(复发、死亡、有效等),也即是研究者关心的结果。

如果将影响因素与疾病发生概率\pi直接建立回归模型,即\pi =\beta _{0}+\beta X,则可能出现\pi大于1或者小于0的情况。流行病学中将发病的概率\pi与未发病的概率(1-\pi)之比称为优势(Odds)。Odds的取值范围是\left (0, +\infty \right ),此时依然无法将取值在(-\infty ,+\infty)的自变量的线性组合建立模型。因此对发病概率进行logit变换。

OR(Odd Ratio):优势比,比如x1表示性别,1表示男生,0表示女性,P1/(1-P1)表示男性发生与不发生的比值,P0/(1-P0)表示女性发生与不发生的优势

参数的意义:

1.β0(常数项)表示暴露剂量为0时个体发病与不发病概率之比的自然对数;

2.βi表示某个危险因素Xi增加一个单位时,结果Y优势比OR的对数值(其他危险因素固定)。

β=0,OR=1,X与Y之间无关β>0,OR>1, X与Y有关,危险因素β 1, "2+", ftv), ftv = factor(ftv) )

 设置因子化,并且利用条件函数巧妙的转化了分类变量。!!!!!好好学习

2. 模型建立

glm1


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3