医学数据缺失值的处理方法之spss回归估计法

您所在的位置:网站首页 spss字符串缺失值处理 医学数据缺失值的处理方法之spss回归估计法

医学数据缺失值的处理方法之spss回归估计法

2024-07-17 06:52| 来源: 网络整理| 查看: 265

在实际工作中,经常会遇到样本数据缺失的问题。数据的缺失可能会造成数据统计结果的偏差,特别是对于样本量不大的资料来说,数据缺失量较大时甚至会影响到最终结论的给出。所以,对数据缺失值进行补充是有一定必要的。

上期,我们谈到了《医学数据缺失值在SPSS中的处理方法之均值替代法》(点击即可观看)

本期,我们继续谈谈数据缺失值的处理方法之回归估计法。回归估计法(regression),即是以存在缺失值的变量为因变量,以其他全部或部分变量为自变量,用无缺失的数据拟合回归方程:以方程的预测值作为该记录缺失值的初步估计值,再以全部数据拟合回归方程;如此迭代,直至两次方程预测值基本一致,并以此作为缺失值的估计值。

下方视频中有完整的理论讲解、spss中的操作步骤、分析结果的解读。看完就会了哦!

一、数据概况

数据具体如下(仅展示存在缺失值数据列),其中,“……”表示该处数据值存在缺失,从数据表可以看出,缺失值主要出现在“舒张压”和“心率”数据列,共存在7处缺失。

二、在SPSS中的操作步骤

①依次点击“分析——缺失值分析”

展开全文

②将变量分别选入“定量变量”和“分类变量”中——勾选“回归”方法。

③点击“回归”选项——勾选“保存完成数据”,并命名新的插补后的数据。

④得到插补后的数据列及具体补充数据。

三、小结

本例以“舒张压”和“心率”为因变量,以“组别”、“性别”、“年龄”、“身高”、“体重”、“收缩压”为自变量,采用回归估计法对存在缺失值的医学数据在SPSS中进行了缺失值的补充步骤展示。回归估计法在进行缺失值填补时较为客观,但可能存在对方差的低估,适用于有适合的“自变量”完整数据存在时。后续,我们将陆续更新更多医学数据缺失值的处理方法,敬请关注!

参考文献:

1、马斌荣,李康.《医学统计学 第6版》.人民卫生出版社.

版权说明:本文系杏花开医学统计原创文章

更多医学统计文章及视频案例教程请关注【杏花开医学统计】微信公众号:xhk345返回搜狐,查看更多

责任编辑:



【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3