生存分析(2)

您所在的位置:网站首页 生存曲线纵坐标取对数 生存分析(2)

生存分析(2)

2024-07-01 16:46| 来源: 网络整理| 查看: 265

接上篇文章生存分析(1),本文将进一步介绍生存分析中有关生存率的具体算法及其应用

Kaplan-Meier法(K-M法、乘积极限法)

Kaplan-Meier法由Kaplan和Meier于1958年提出,直接用概率乘法定理估计生存率,故称乘积极限法(product-limit method),是一种非参数法。 这里写图片描述

1.计算方法

a. 将样本生存时间T从小到大排列成如表第1栏。若遇到非删失值和删失值相同时,非截删失排在前面。 b. 列出与T相应的死亡人数d,如表第2栏 c. 列出期初病例数n,如表第3栏,即生存期为某时间时尚存活的病例数 d. 计算活过各时点的生存率P(T>t),计算公式为

P(T>t)=∏p=∏n−dn

2.标准误计算

均数的标准误 为了表示均数的抽样误差大小如何,用的一种指标称为均数的标准误。我们以样本均数为变量,求出它们的标准差即可表示其变异程度,所以将样本均数这“标准差”定名为均数的标准误,简称标准误,以区别于通常所说的标准差。标准差表示个体值的散布情形,而标准误则说明样本均数的参差情况,两者不能混淆。 (具体可参考这里的介绍)

对于K-M法,标准误的计算方法有两种: Sp(T>t)=P(T>t)∑d(n−d)n−−−−−−−√

Sp(T>t)=P(T>t)1−P(t>t)n−d−−−−−−−√

例数较多时,两法计算结果相同,但例数逐渐减少,法1的结果偏小,法二的结果偏大。

3.生存率的可信区间

利用正态近似原理,估计总体生存率的可信区间,如95%置信度

可信区间=P(T>t)±1.96Sp(T>t) 上表中存活时间大于30天,生存率的95%可信区间为 P(T>30)±1.96×0.1107=(0.4646,0.8486)

4.单因素分析(log-rank test)

对数秩检验(log-rank test) 属于非参数检验,用于比较两组或多组生存曲线或生存时间是否相同 检验统计量为卡方 χ2 自由度=组数-1

χ2=∑(A−T)2T 其中A为观察死亡数,T为理论死亡数。当有Tn)∑qpN−−−−−−−√

3.生存率可信区间

同K-M法

K-M法与寿命表法比较

1.格式与精确度 K-M法使用患者实际寿命作为分布区间,相对更精确 寿命表法采用人为规定时间段作为分布区间,范围扩大精确度有所下降

2.适用范围 K-M法更适合于样本量较少的数据 寿命表法更适合于样本量较大的数据 (不过,考虑到现在计算能力的强大,一般程度的数据量并不会对计算速度有太大影响)

3.关注点不同 K-M法关注每一个时点的生存率,重视对生存率规律的细致把握,可以利用K-M的结果去研究影响生存率变化(如曲线的突变点)的影响因素。 寿命表法则更重视对生存规律的总体把握(如各年生存率的情况)。

至此,有关生存分析的非参数研究方法K-M与寿命表法就介绍完了。接下来的一篇文章,将介绍含参数的研究方法—Cox比例风险回归模型。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3