有序logistic回归分析(Ordinal Logistic Regression Analysis)

您所在的位置:网站首页 VIF小于多少 有序logistic回归分析(Ordinal Logistic Regression Analysis)

有序logistic回归分析(Ordinal Logistic Regression Analysis)

2024-07-06 15:00| 来源: 网络整理| 查看: 265

在前面文章中介绍了有序logistic回归分析(Ordinal Logistic Regression Analysis)的假设检验理论,本篇文章将实例演示在SPSS软件中实现有序logistic回归分析的操作步骤。

关键词:SPSS; 有序logistic回归; 有序逻辑回归; 平行性检验; 比例优势检验

一、案例介绍

在某胃癌筛查项目中,为了确定胃癌筛查的重点人群,研究者想了解首诊“胃癌分期(Stage)”与患者“经济水平(Income)”、“性别(Gender)”和“年龄(Age)”之间的关系,试对数据进行分析。

创建表示胃癌分期的变量“Stage”(1=I-II期、2=III期、3=IV期、4=V期,测量尺度设为“Ordinal(有序分类变量)”;创建表示经济水平的变量“Income”(1=低水平、2=中等水平、3=高水平),测量尺度设为“Ordinal(有序分类变量)”;创建表示性别的变量“gender”(1=女性、0=男性),测量尺度设为“Nominal(分类变量)”;创建表示年龄的变量“age”,测量尺度设为“Scale(连续变量)”。部分数据见图1。本文案例可从“附件下载”处下载。

图1 二、问题分析

本案例的分析目的是探讨首诊“胃癌分期”与患者“经济水平”、“性别(Gender)”和“年龄(Age)”之间的关系。在案例中,首诊“胃癌分期”为因变量,有I-II期、III期、IV期、V期4个分类,且分类间有等级次序关系。因此,可以采用有序logistic回归模型进行分析。但需要满足以下5个条件:

条件1:因变量唯一,且为有序多分类变量。本研究中因变量为“胃癌分期”,且为有序多分类变量,该条件满足。

条件2:存在一个或多个自变量。本研究中有三个自变量,“性别”和“经济水平”为分类变量,“年龄”为连续变量,该条件满足。

条件3:观测值相互独立。本研究中各研究对象的观测值都是独立的,不存在互相干扰的情况,该条件满足。

条件4:自变量之间无多重共线性,该条件需要通过软件分析后判断。

条件5:满足平行性,该条件需要通过软件分析后判断。

三、软件操作及结果解读 (一) 适用条件判断 1. 哑变量设置

容忍度(Tolerance)或方差膨胀因子(VIF)可以用来诊断自变量之间的多重共线性。SPSS的广义线性模型不能提供这两个指标,可以通过线性回归来获得。进行线性回归的共线性诊断前需要对多分类变量设置哑变量,以下将对多分类变量“Age”进行哑变量设置。

(1) 软件操作

① 点击“转换”—“创建虚变量”(图2)。

图2

② 在“创建虚变量”对话框中将变量“Income”选入右侧“针对下列变量创建虚变量”框中,然后在“创建主效应虚变量”下的“根名称-每个选定变量各一个”中输入虚拟变量的名称“Income”。点击“确定”,完成虚拟变量设置(图3)。

图3 (2) 结果解读

上述步骤运行结束后可以在数据编辑页面看到新生成的3个哑变量(图4),随后就可以进行多重共线性诊断。

图4 2. 条件4判断(多重共线性诊断) (1) 软件操作

① 点击“分析”—“回归”—“线性”(图5)。

图5

② 将变量“Stage”选入“因变量”,将需要进行多因素分析的变量 “Gender”和“Age”选入“自变量”(图6),然后点击“下一个”。在图7中将“Income=2”和“Income=3”两个虚拟变量同时选入右侧“自变量”,此即哑变量设置的同进同出原则,此时表示以“Income=1”为参照水平;“方法”选择“输入”。

图6 图7

③ 点击“统计”,在“统计”子对话框中勾选“共线性诊断”(图8),点击“继续”后回到主对话框,点击“确定”。

图8 (2) 结果解读

如果“容差”小于0.1或“VIF(方差膨胀因子)”大于10,则提示有严重共线性存在。本例中(图9),容忍度均远大于0.1,方差膨胀因子均小于10,提示自变量之间不存在严重多重共线性。如果数据存在严重多重共线性,需用复杂的方法进行处理,其中最简单的是剔除引起共线性的因素之一,剔除哪一个因素可以基于理论依据。

图9 3. 条件5判断(平行性检验)

平行性检验的结果可与统计推断结果一起输出,详见下文。

(二) 统计推断 1. 软件操作

① 点击“分析”—“回归”—“有序...”(图10)。

图10

② 在“有序回归”对话框中将变量“Stage”选入“因变量”,将分类变量“Gender”和“Income”选入“因子”。将连续变量“Age”选入“协变量”位置(图11)。

图11

③ 点击右侧“输出”,在输出对话框中选中“平行线检验”,其他选项保持不变,点击“继续”回到主对话框后点击“确定”(图12)。

图12 2. 结果解读 (1) 平行性检验

图13显示了平行线检验结果,χ²= 3.110,P=0.927,说明平行性假设成立,即各回归方程相互平行,故满足条件5,可以使用有序Logistic回归进行分析。

如果平行线假设不能满足,可以考虑以下两种方法进行处理:

① 进行无序多分类Logistic回归,而非有序Logistic回归,此种处理因变量会失去有序的属性;

② 用不同的分割点将因变量变为二分类变量,分别进行二分类Logistic回归。

图13 (2) 模型评价

图14给出的是数据的一般情况,展示了各变量的个案数和所占比例。

图14

图15“模型拟合信息”是对模型中所有自变量偏回归系数是否均为0进行似然比检验。其中-2对数似然值越小越好,从结果中可以看出,加入自变量后的模型比只有常数项的值更小(347.737



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3