数据中病例数与对照数比例悬殊,怎么办?

您所在的位置:网站首页 字符数与字数相差很大怎么办 数据中病例数与对照数比例悬殊,怎么办?

数据中病例数与对照数比例悬殊,怎么办?

2023-08-29 07:22| 来源: 网络整理| 查看: 265

第二点必须认识到:匹配选对照只会弄巧成拙。

原因有四点:

首先,损失了样本量,降低检验效率。这点非常好理解,只挑一部分人来做研究,损失了样本量,降低检验效率。

第二,匹配选样本有可能带来选择偏性。什么是选择偏性?道理很简单,看我收入高不高,选马云做对照还是选丐帮帮主做对照,结果是完全不同的,不选就不会选偏,天然的是最好的。

第三,不能分析匹配因素与Y的关系。

第四,不能正确估计与匹配因素相关的X的效应。

关于这后面两点,我们通过JAMA子刊这篇文章来实例讲解。摘要Results部分,看红框的内容:肥胖和脑血栓有关系,校正后的OR值是2.63,表明考虑到其他的混杂因素影响之后,肥胖(BMI大于等于30)的人和不肥胖的人相比,发生脑血栓的风险增加1.63倍。如果本研究匹配了BMI,使得肥胖在脑血栓组和对照组均匀分布,就不能分析肥胖对脑血栓的作用了。这点不难理解。

匹配选对照的只会弄巧成拙,不能正确估计与匹配因素相关的X的效应。可以想象,性别和本研究的X(肥胖)是有关系的,通常认为男女肥胖程度不同,如果本研究匹配了性别,很可能打破性别与X的真实关系,无法正确估计性别和肥胖之间的关系。

【要点小结】不选就不会选偏。如果觉得两组例数悬殊,组间配不平了,所以去匹配,很可能弄巧成拙。走弯路的原因是不懂研究设计的要点,不懂如何判断偏性。

什么时候需要去挑对照呢?

还是这个例子:回顾性调查了300例病人,其中有18例有某并发症,282例没有并发症。

如果研究入院时血压和并发症的关系,每位患者血压的值都有了,不需要花钱、花人力去收集,就不需要挑选对照了。

如果要研究的是基因型和并发症的关系,具体实施过程遇到下面的问题,这时可以挑选对照,从282例里挑一部分来做研究,这是没办法做的情况下不得不去挑的,是下策:

钱不够:只有检测40例的课题经费

没时间、科研人员人手不够等

钱不够:只有检测40例的课题经费

没时间、科研人员人手不够等

懂了前面的道理,再来看新英格兰这篇文章,就真正理解他为什么要挑选对照了。因为这篇文章的作者在做这篇文章的时候,还没有现成的数据,需要花钱花人力去收集,测量很多评价动脉粥样硬化的指标,所以作者需要精打细算,需挑选一部分人做对照,目的是节省资源。

研究动脉粥样硬化和静脉血栓的关系,从摘要的方法学部分,看出是病例对照研究(病例299例、对照150例)。具体在方法学部分写了匹配方法:选择跟病例在同一间病房,并且年龄相差不超过5岁,并且匹配性别来挑选对照的。

作者也是很谨慎的,努力避免人为挑选对照带来的偏性。这是研究设计的亮点!

作者选择同一个病区的同一间病房(same room in the ward)的人做对照,是什么目的呢?因为通常同一间病房是同一班医生和护士管病人,这样可以避免医护人员水平不同带来的偏向性。

为何选第一个入住(the first patient)这间病房的患者呢?因为和病例入住时间接近,医院的医疗环境、诊疗方案、甚至气候环境因素都很接近,目前是控制混杂。这样选对照也不会带来选择偏性。

年龄相差不超过5岁,并且匹配性别来挑选对照。目的是控制年龄和性别的混杂。返回搜狐,查看更多



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3