分层数据:Cochran |
您所在的位置:网站首页 › 病例对照研究采用分层方法 › 分层数据:Cochran |
1. 概述
Cochran-Mantel-Haenszel, 简称CMH检验,是研究两个我们关注的分类变量之间关联性的一种检验方法。但有时数据除了我们研究的变量外,还混杂或隐含了其它的变量,如果将这些变量纳入分析中,则有可能得出完全不同的结论,著名的Simpson悖论就是这个问题的典型案例。 换句话说,在2 x 2 表格数据的基础上,引入了第三个分类变量,称之为混杂变量。混杂变量的引入使得该检验可以用于 分析分层样本,作为生物统计学领域的一种常用技术,该检验常用于疾病对照研究。 美国法律学家辛普森(Simpson),在研究美国佛罗里达州的犯罪问题时发现,白人杀手被处死刑的比率要高于黑人杀手;但如果把被害人的肤色也考虑进来时,他发现,不论被害者是白人还是黑人,白人杀手被处死刑的比率要低于黑人杀手,这就得出了矛盾的结论,他认为这是个悖论,故此类现象统称为“Simpson悖论”。 对于这种分层的列联表,通常可以各层单独做卡方检验。但除此之外,我们还想知道在数据分层条件下,总体的状态如何,此时分层的作用就像是试验设计中的区组化,虽然分层可能对卡方检验结果有影响,但我们并不关注它,而是考虑排除其影响后卡方检验的显著性。这种方法就是Cochran-Mantel-Haenszel检验,简称CMH检验或MHC检验。 2. 第一个示例:螺栓合格率在这个案例中,书(《六西格玛管理统计指南》)中已经得出结论:如果不考虑将螺栓细分为螺钉和螺母,则两个车间的不合格率存在显著差异,且B车间的不合格率更低一些;但数据细化以后,以螺钉和螺母作为层,则看到无论是哪一种产品,都是车间A的不合格率更低。两种检验的结论完全不同。下一步我们还想采用CMH检验来看看在数据有分层的情况下,两个车间的不合格率的差异如何。 首先引入一个新的概念,优势比(Odds Ratio,OR),又称比值比、胜算比等,这个名称将来在Logistic回归中会经常用到。 所谓Odds,就是每一个分组的胜率(或败率,取决于A代表的是成功还是失败),即: O d d s ( X 1 ) = A B Odds(X1) = \frac{A}{B} Odds(X1)=BA O d d s ( X 2 ) = C D Odds(X2) = \frac{C}{D} Odds(X2)=DC 而Odds Ratio就是: O R = O d d s ( X 1 ) O d d s ( X 2 ) = A B C D = A ∗ D B ∗ C OR = \frac{Odds(X1)}{Odds(X2)}=\frac{\frac{A}{B}}{\frac{C}{D}}=\frac{A*D}{B*C} OR=Odds(X2)Odds(X1)=DCBA=B∗CA∗D 若OR=1,则X1和X2的胜率(或败率)没有差别;若OR>1,则X1的胜率(或败率)高于X2;若OR |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |