生存分析(2) |
您所在的位置:网站首页 › 生存曲线纵坐标取对数 › 生存分析(2) |
接上篇文章生存分析(1),本文将进一步介绍生存分析中有关生存率的具体算法及其应用 Kaplan-Meier法(K-M法、乘积极限法)Kaplan-Meier法由Kaplan和Meier于1958年提出,直接用概率乘法定理估计生存率,故称乘积极限法(product-limit method),是一种非参数法。 a. 将样本生存时间T从小到大排列成如表第1栏。若遇到非删失值和删失值相同时,非截删失排在前面。 b. 列出与T相应的死亡人数d,如表第2栏 c. 列出期初病例数n,如表第3栏,即生存期为某时间时尚存活的病例数 d. 计算活过各时点的生存率P(T>t),计算公式为 P(T>t)=∏p=∏n−dn 2.标准误计算均数的标准误 为了表示均数的抽样误差大小如何,用的一种指标称为均数的标准误。我们以样本均数为变量,求出它们的标准差即可表示其变异程度,所以将样本均数这“标准差”定名为均数的标准误,简称标准误,以区别于通常所说的标准差。标准差表示个体值的散布情形,而标准误则说明样本均数的参差情况,两者不能混淆。 (具体可参考这里的介绍) 对于K-M法,标准误的计算方法有两种: Sp(T>t)=P(T>t)∑d(n−d)n−−−−−−−√ Sp(T>t)=P(T>t)1−P(t>t)n−d−−−−−−−√ 例数较多时,两法计算结果相同,但例数逐渐减少,法1的结果偏小,法二的结果偏大。 3.生存率的可信区间利用正态近似原理,估计总体生存率的可信区间,如95%置信度 可信区间=P(T>t)±1.96Sp(T>t) 上表中存活时间大于30天,生存率的95%可信区间为 P(T>30)±1.96×0.1107=(0.4646,0.8486) 4.单因素分析(log-rank test)对数秩检验(log-rank test) 属于非参数检验,用于比较两组或多组生存曲线或生存时间是否相同 检验统计量为卡方 χ2 自由度=组数-1 χ2=∑(A−T)2T 其中A为观察死亡数,T为理论死亡数。当有Tn)∑qpN−−−−−−−√ 3.生存率可信区间同K-M法 K-M法与寿命表法比较1.格式与精确度 K-M法使用患者实际寿命作为分布区间,相对更精确 寿命表法采用人为规定时间段作为分布区间,范围扩大精确度有所下降 2.适用范围 K-M法更适合于样本量较少的数据 寿命表法更适合于样本量较大的数据 (不过,考虑到现在计算能力的强大,一般程度的数据量并不会对计算速度有太大影响) 3.关注点不同 K-M法关注每一个时点的生存率,重视对生存率规律的细致把握,可以利用K-M的结果去研究影响生存率变化(如曲线的突变点)的影响因素。 寿命表法则更重视对生存规律的总体把握(如各年生存率的情况)。 至此,有关生存分析的非参数研究方法K-M与寿命表法就介绍完了。接下来的一篇文章,将介绍含参数的研究方法—Cox比例风险回归模型。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |