超几何分布检验(hypergeometric test)

您所在的位置:网站首页 超几何是什么意思 超几何分布检验(hypergeometric test)

超几何分布检验(hypergeometric test)

2022-12-29 13:53| 来源: 网络整理| 查看: 265

1、超几何分布检验本质:是对venn图两个圈overlap的显著性进行检验设总共有29个人,其中11个吸烟者,18个非吸烟者,现从中随机抽取16个样本(在此实验中对应着肺癌病人),有10个是吸烟者,这样的事件是否显著?用venn图表示为:

用R语言计算:

p-value=phyper(10-1, 11, 18, 16, lower.tail=F)=0.003135274

可以看出此结果跟我们在2中手动算出来的结果相同,为单侧检验。

lower.tail=F 表示结果1-重合程度: 1-phyper(9, 11, 18, 16)=phyper(10-1, 11, 18, 16,lower.tail=F)2、次品检验问题

工厂生产了N个零件,其中有M个零件是次品,在一次抽样调查中随机抽取n个零件,其中有m个零件是次品,问这次的抽样检查是否合格?也就是要通过抽样调查判断样本是否服从整体的分布。该抽样方法服从超几何分布,利用R中自带的phyper函数可以计算出p-value,这个p-value代表了抽样服从整体的可能性。

pvalue = phyper(m,M,(N-M),n,lower.tail=F)

计算出来的p-value需要进行FDR矫正,经过矫正后的FDR值如果小于0.05则否认原假设,认为抽样不符合整体,抽样结果不合格。

qvalue = p.adjust(pvalue,method='fdr')3、一个临床上有趣的问题

有135个肺癌患者,已知这些患者的临床表征(性别、年龄、是否吸烟等),在计算中发现了EGFR基因在队列中显著突变,现在想知道某个临床表征(比如吸烟)对EGFR基因的突变有没有显著的影响?

类比零件抽样调查的问题,我们需要找到队列总人数135,队列中含有EGFR突变的总人数90,队列中吸烟的人数70,吸烟人群中含有EGFR突变的人数54,然后利用phyper函数进行计算:

pvalue

参考:

phyper函数计算的显著性到底是什么?_viancheng的博客-CSDN博客_phyper计算公式

超几何分布检验(hypergeometric test)以及R中实现



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3