怎么连续阴性?抛硬币的“大数定律”解释基因突变阳性率,样本量大才有统计意义!

您所在的位置:网站首页 抛硬币定律 怎么连续阴性?抛硬币的“大数定律”解释基因突变阳性率,样本量大才有统计意义!

怎么连续阴性?抛硬币的“大数定律”解释基因突变阳性率,样本量大才有统计意义!

2024-07-15 09:11| 来源: 网络整理| 查看: 265

基因谷已关注

分享点赞在看

已同步到看一看 写下你的评论

分享视频

,时长01:31

0/0

00:00/01:31

切换到横屏模式

继续播放

进度条,百分之0

播放

00:00

/

01:31

01:31

全屏

倍速播放中

0.5倍 0.75倍 1.0倍 1.5倍 2.0倍

超清 流畅

继续观看

怎么连续阴性?抛硬币的“大数定律”解释基因突变阳性率,样本量大才有统计意义!

观看更多

转载

,

怎么连续阴性?抛硬币的“大数定律”解释基因突变阳性率,样本量大才有统计意义!

基因谷已关注

分享点赞在看

已同步到看一看 写下你的评论

视频详情

视频来源于网络,作者:后浪の浪浪子

2022年2月,国家癌症中心发布了最新的全国癌症统计数据。2016年,我国癌症新发病例约为406.4万例,比2015年增加13.5万例(3.44%)。其中,肺癌新发病例人数约为82.8万例,在所有恶性肿瘤中,肺癌的发病率和死亡率均最高。

图1

根据肺癌生物学特征,非小细胞肺癌(NSCLC)占所有肺癌的80%~85%。指南和专家共识推荐,早中期NSCLC患者可进行EGFR敏感突变、PD-L1检测,指导术后辅助治疗。另外,推荐所有的晚期NSCLC患者进行EGFR、ALK、KRAS、ROS1等靶向驱动基因,以及PD-L1检测,指导靶向、免疫治疗。

图2:2023 CSCO非小细胞肺癌诊疗指南

图3:2023.v3版 NCCN非小细胞肺癌指南

然而,不是所有的患者都能检测出这些可用药的驱动基因变异(肿瘤基因检测报告阴性就没意义?NO!先理性看待结果,再跳出思维误区!)。因此,患者就会关心自己有多大的概率检测出这些基因变异呢。我们以EGFR为例,探讨一下“阳性率”这个问题。

大型临床研究中,中国NSCLC的EGFR突变阳性率

一项研究显示,在2694例中国NSCLC患者中,EGFR突变阳性率为38.1%,女性的EGFR突变阳性率高于男性(53.9% vs 26.5%),从未吸烟者的EGFR突变阳性率高于当前吸烟者+已戒烟者(57.6% vs 40.0%)[1]。

图4

吴一龙教授团队曾对多项研究进行了汇总分析,发现在中国NSCLC患者中,EGFR突变阳性率为28.2%(图5A),其中肺腺癌的EGFR突变阳性率为48.4%(图5B),肺鳞癌的为4.3%(图5C)[2]。

图5

另一项研究全面分析了中国NSCLC中的驱动基因变异图谱,包括肺腺癌1356例、鳞状细胞癌503例、腺鳞癌57例、大细胞癌19例、肉瘤样癌8例。研究显示,肺腺癌的EGFR突变阳性率为63.1%,鳞状细胞癌的为3.9%,腺鳞癌的为35.1%,大细胞癌的为15.8%,而在肉瘤样癌中则未检出EGFR突变[3]。

图6

综上可以看出,EGFR基因突变是我国NSCLC最常见的驱动基因突变,且EGFR突变阳性率受性别、吸烟状况以及组织学类型等多种因素的影响。基于现有的临床数据,专家共识也明确提到,在东亚人群中,NSCLC的EGFR基因突变发生率为30%~40%,其中,我国肺腺癌患者EGFR基因敏感突变阳性率为50%左右。

图7

图8

那么,在检测过程中,我们是否就可以认为连续10例NSCLC就会有3~4例检测出EGFR基因突变,或者说,连续20例肺腺癌就会有约10例检测出EGFR基因突变。其实,这样的理解是片面的。因为上述专家共识中提到的发生率“30%~40%”以及“50%左右”均是建立在“大数定律”基础之上的。那么什么是“大数定律”呢?和我们所说的基因突变阳性率又有什么关系呢?

基于掷硬币的故事,解析EGFR突变阳性率遵循大数定律

在生活中,当你为做一个两难的决定犹豫不决时,是否会用抛硬币的方法来决定呢?一般来讲,当我们抛硬币时,正面朝上(可以假设为肺腺癌中EGFR突变阴性)和反面朝上(可以假设为肺腺癌中EGFR突变阳性)的概率是相同的,均为50%。但是,如文章开头视频中所说的,万一出现前20次均为正面时,下一次出现反面的概率会不会变大呢?有很多人会认为已经出现那么多次正面了,总该来一次反面吧。但事实上,硬币并没有记忆,下一次的概率还是50%,与之前的结果没有关系。其实这里就出现了一个现象,也许进行10次抛硬币,结果全部是正面。但是随着抛的次数增加到100次、1000次会发生什么呢?

1939年,南非数学家克里奇冒失地跑到欧洲,结果被关进集中营。他给自己找到了一个有趣的乐子:他将一枚硬币抛了 1万次,记录了正面朝上的数量,统计结果如图9所示:如果抛10次,正面朝上的概率为30%~90%;如果抛100次,比例范围就缩小了,变为40%~60%;如果抛1000次,比例范围就会缩小到46.2%~53.7%。

图9:来自《魔鬼数学》

我们会发现正面朝上的概率从一开始的大幅度波动逐步会趋于平缓,也就是越来越接近50%。究竟是什么无形之手的力量,把图中那些比较大的波动,一点点摁平的?其实是“大数定律”在起作用。因为随着后面丢硬币的次数增加,前面10次的影响对于整体的影响是不断削弱的,也就是说后面新的抛硬币会稀释掉一开始那部分。

同样的道理,引申到我们日常检测样本中,起初的连续数十例样本的统计可能处于曲线图中前部分的波动大现象,可能阴性率极高。换句话说,我们平常统计的数十例样本的统计学意义相对有限,而随着检测样本量的积累,后续的阳性率必然跟随曲线的波动情况逐步趋近于我们所认识的突变率大数据,即当样本量越大时,才越具有统计学意义。所以,请抱有信心持续检测,随着数据的不断积累,阳性率更为可观。

另外,样本类型对于基因变异的检出率也是有一定的影响的。第三代EGFR-TKI耐药后诊疗策略专家共识提到,基因检测应首选组织样本进行检测,若组织样本获取困难、有相当风险和/或患者具有强烈的无创分子诊断愿望时,可选择外周血样本进行替代,对于存在脑转移或胸腹水的患者,也可采用脑脊液,胸腹水等体液样本进行分子检测。

图10

2023年最新分别发表在CCR(Clin Cancer Res)杂志上的LC-SCRUM-Liquid研究,基于Guardant 360 ctDNA检测技术(FDA获批)评估了1062例NSCLC患者血浆cfDNA和组织测序的一致性。结果显示,组织的阳性率为50.5%,血液的阳性率为42.8%。其中,EGFR突变-组织的阳性率为26.4%,EGFR突变-血浆cfDNA的为24.0%;ALK融合-组织的阳性率为4.2%,ALK融合-血浆cfDNA的为2.4%;ROS1融合-组织的阳性率为1.5%,ROS1融合-血浆cfDNA的为0.3%[4]。

图11

图12:基于组织检测各驱动基因变异的阳性率

图13:基于血浆cfDNA检测各驱动基因变异的阳性率

点击加入基因俱乐部 成就行业精英

目前已有600+行业精英加入基因俱乐部

已发布各类基因科技行业报告2300多份返回搜狐,查看更多



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3