生存分析中的几个基本概念 |
您所在的位置:网站首页 › 自变量的概念是指 › 生存分析中的几个基本概念 |
生存时间也是一个广义概念,不单是指通常意义下生物体的存活时间,而是泛指研究者所关心的某现象的持续时间,如白血病患者化疗后的缓解时间、肾移植患者的存活时间、接受健康教育后青少年的戒烟时间、投保某种健康险至中途退保的时间等。 生存时间根据其不同的特点,可分为以下两种类型: (1) 完全数据(complete data):指从观察起点到发生死亡事件所经历的时间,如患者的生存天数89天和85天。 (2) 截尾数据(censored data):简称截尾值(censored value),又称删失值或终检值。生存时间观察过程的截止不是由于死亡事件,而是由于其他原因引起的,称为截尾(censored)。 截尾的主要原因有以下三种: ①失访(withdrawal):指失去联系,如信访无回音、电话采访不应答、上门采访找不到人、搬迁没留地址等; ②退出:指死于非研究因素或非处理因素而退出研究,如死于车祸等意外事件、死于其它疾病等; ③终止:指设计时规定的研究时限已到而终止观察,但研究对象仍然存活。从观察起点到截尾时点所经历的生存时间称为截尾数据,习惯上在生存时间右上标注“+”表示。 完全数据提供了观察对象确切的生存时间,是生存分析的主要依据;截尾数据仅提供了部分信息,研究者并不知道观察对象确切的生存时间。因此,截尾数据太多会影响生存分析的效果。 3. 死亡概率与生存概率 (1) 死亡概率(mortality probability): 记为,是指在某单位时段开始时存活的个体在该时段内死亡的可能性大小。 若年内有截尾,则分母用校正人口数: (2) 生存概率(survival probability): 记为,与死亡概率相对立,表示在某单位时段开始时存活的个体到该时段结束时仍存活的可能性大小。某年生存概率的计算公式为: 分子即年底尚存人数,若年内有截尾,则分母用校正人口数。 4. 生存率与生存曲线 (1) 生存率(survival rate): 记为S(t),是指观察对象活过tk时刻的概率。生存率也是一个广义概念,研究者定义的死亡事件不同,其含义亦不同,可以是缓解率、有效率等。如定义白血病化疗的死亡事件为白血病复发,此时生存率即为缓解率;定义预防接种腮腺炎疫苗的死亡事件为接种儿童发生腮腺炎,此时生存率即为疫苗的有效率;定义安置宫内节育器的死亡事件为因带环受孕取出节育器,此时生存率即为节育器的保留率。若无截尾数据,则 式中T为观察对象的存活时间。但如果含有截尾数据,分母就必须分时段校正,故上式一般不能直接使用,大多采用概率乘法原理估计生存率。 假定观察对象在各个时段的生存事件独立,生存概率分别为,则根据概率乘法原理得到生存率的估计公式为: 从上式可知,实质上是累积生存概率(cumulative probability of survival)。例如,3年生存率等于第一年、第二年和第三年生存概率的连乘积,是第一年存活,第二年也存活,第三年仍然存活的累积结果。但习惯上仍称之为生存率。 (2) 生存曲线(survival curve):是指将各个时点的生存率在坐标轴上连接在一起的曲线图,用以描述生存过程。 5. 中位生存时间(median survival time) 又称半数生存期,是指生存率为0.5时对应的生存时间,表示有50%的观察对象可活这么长时间。一般采用内插法进行估计。 生存分析方法可以分为描述法、参数法、半参数法和非参数法 1.描述法 根据样本观测值提供的信息,直接用公式计算出每一个时间点或每一个时间区间上的生存函数、死亡函数、风险函数等,并采用列表或绘图的形式显示生存时间的分布规律。 优点:方法简单且对数据分布无要求 缺点:不能比较两组或多组生存时间分布函数的区别,不能分析危险因素,不能建立生存时间与危险因素之间的关系模型。 2.非参数法 估计生存函数时对生存时间的分布没有要求,并且检验危险因素对生存时间的影响时采用的是非参数检验方法。 常用方法:乘积极限法、寿命表法 优点:可以估计生存函数,可以比较两组或多组生存分布函数。可以分析危险因素对生存时间的影响,对生存时间的分布没有要求。 缺点:不能建立生存时间与危险因素之间的关系模型。 3.参数法 根据样本观测值来估计假定的分布模型中的参数,获得生存时间的概率分布模型。 生存时间经常服从的分布有:指数分布、Weibull分布、对数正态分布、对数Logistic分布、Gamma分布。 优点:可以估计生存函数,可以比较两组或多组生存分布函数。可以分析危险因素对生存时间的影响,可以建立生存时间与危险因素之间的关系模型。 缺点:需要事先知道生存时间的分布 4.半参数法 不需要对生存时间的分布做出假定,但是却可以通过一个模型来分析生存时间的分布规律,以及危险因素对生存时间的影响,最著名的就是COX回归。 优点:可以估计生存函数,可以比较两组或多组生存分布函数。可以分析危险因素对生存时间的影响,可以建立生存时间与危险因素之间的关系模型,不需要事先知道生存时间的分布。 参考资料山东大学统计学系
|
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |