分层数据:Cochran

您所在的位置:网站首页 病例对照研究采用分层方法 分层数据:Cochran

分层数据:Cochran

2023-07-03 17:35| 来源: 网络整理| 查看: 265

1. 概述

Cochran-Mantel-Haenszel, 简称CMH检验,是研究两个我们关注的分类变量之间关联性的一种检验方法。但有时数据除了我们研究的变量外,还混杂或隐含了其它的变量,如果将这些变量纳入分析中,则有可能得出完全不同的结论,著名的Simpson悖论就是这个问题的典型案例。

换句话说,在2 x 2 表格数据的基础上,引入了第三个分类变量,称之为混杂变量。混杂变量的引入使得该检验可以用于 分析分层样本,作为生物统计学领域的一种常用技术,该检验常用于疾病对照研究。

美国法律学家辛普森(Simpson),在研究美国佛罗里达州的犯罪问题时发现,白人杀手被处死刑的比率要高于黑人杀手;但如果把被害人的肤色也考虑进来时,他发现,不论被害者是白人还是黑人,白人杀手被处死刑的比率要低于黑人杀手,这就得出了矛盾的结论,他认为这是个悖论,故此类现象统称为“Simpson悖论”。 在这里插入图片描述 从表中可以看出,黑人凶手被判处死刑的比率低于白人凶手。但是如果加上被害人的肤色,则有更详细的数据。 在这里插入图片描述 加入被害人信息后,不论被害人是白人或黑人,白人凶手被处死的比率都低于黑人。形成这种悖论的原因是,被害人是白人时凶手被处死的比率要高于被害人是黑人时凶手被处死的比率。由于白人凶手杀害的更多的是白人,因此造成“白人杀手被处死刑的比率要高于黑人杀手”。辛普森所指出的问题是非常重要的一个概念,但他的原始数列并不具有统计意义上的显著性(卡方检验不显著)。

对于这种分层的列联表,通常可以各层单独做卡方检验。但除此之外,我们还想知道在数据分层条件下,总体的状态如何,此时分层的作用就像是试验设计中的区组化,虽然分层可能对卡方检验结果有影响,但我们并不关注它,而是考虑排除其影响后卡方检验的显著性。这种方法就是Cochran-Mantel-Haenszel检验,简称CMH检验或MHC检验。

2. 第一个示例:螺栓合格率

在这个案例中,书(《六西格玛管理统计指南》)中已经得出结论:如果不考虑将螺栓细分为螺钉和螺母,则两个车间的不合格率存在显著差异,且B车间的不合格率更低一些;但数据细化以后,以螺钉和螺母作为层,则看到无论是哪一种产品,都是车间A的不合格率更低。两种检验的结论完全不同。下一步我们还想采用CMH检验来看看在数据有分层的情况下,两个车间的不合格率的差异如何。 在这里插入图片描述 这个表格包含两个四格表,将其一般化,我们得到k层四格表。 在这里插入图片描述 其中i=1,…,k。

优势比 概念

首先引入一个新的概念,优势比(Odds Ratio,OR),又称比值比、胜算比等,这个名称将来在Logistic回归中会经常用到。 所谓Odds,就是每一个分组的胜率(或败率,取决于A代表的是成功还是失败),即: O d d s ( X 1 ) = A B Odds(X1) = \frac{A}{B} Odds(X1)=BA​ O d d s ( X 2 ) = C D Odds(X2) = \frac{C}{D} Odds(X2)=DC​ 而Odds Ratio就是: O R = O d d s ( X 1 ) O d d s ( X 2 ) = A B C D = A ∗ D B ∗ C OR = \frac{Odds(X1)}{Odds(X2)}=\frac{\frac{A}{B}}{\frac{C}{D}}=\frac{A*D}{B*C} OR=Odds(X2)Odds(X1)​=DC​BA​​=B∗CA∗D​

若OR=1,则X1和X2的胜率(或败率)没有差别;若OR>1,则X1的胜率(或败率)高于X2;若OR


【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3