谈谈二分类变量

您所在的位置：网站首页 › 无序分类变量 › 谈谈二分类变量

谈谈二分类变量

#谈谈二分类变量| 来源: 网络整理| 查看: 265

原标题：谈谈二分类变量

文章作者：JimmyChow

很多医生都会拿数据做两变量间的相关分析，分类变量有二分类变量、有序分类变量、无序分类变量，今天，我们就聊聊二分类变量。

二分类变量即为那些结局只有两种可能性的变量，如有效与否，心梗，心血管不良事件，死亡等，一般将发生事件的人数除以样本量总数得到的事件发生率作为结局考察。

常见的二分类变量包括：OR (Odds Ratio) 值，RR (Risk Ratio) 值，RD (Risk Difference) 值。他们的计算公式如下所示：

从以上公式可以看得出OR值与RR值之间是可以相互换算的，换算公式如下所示：

虽然他们可以相互换算，但是他们所体现的结果却不一样。

例如：当干预措施A与干预措施B相比结局的RR为0.25，我们可以解读结果为A结局发生的风险为B的0.25。但是当A比B结局的OR值为0.25，我们只能解读为A比B的结局发生风险更低，如果需要提供准确数字，则需要将OR值转化为RR值（0.25）后解读为A结局发生的风险为B的0.25，不可直接解读。

当OR值与RR值事件发生数为0时如何处理?

从上述公式中可以发现，OR值与RR值的结局发生数不能为0，同时计算方差时结局的发生数也不能为0。然而，当临床研究纳入样本量不足，或者结局事件（不良反应）发生率极低时，结局发生数为0。这时比较常用的方法是假设事件发生数为1/2。在Revman里面，当有一组的事件发生数为0时，软件自动在两组的事件发生数添加1/2。当比较的两组事件发生数均为0时，则该对比没有提供两组效应量比较的信息，所以我们需要将这篇研究剔除。

什么时候使用RD?

结局发生率非常小时，也会使用RD值。OR值和RR值是相对的概念，而RD为绝对的概念。假设A结局发生率为0.001，B结局发生率为0.0005，如使用RR值进行比较，A比B的RR值为2.00，显示出A较B的结局发生率非常高。此时，假如使用的是RD值，得出的结果为A比B的RD值为0.0005，则即A较B所增加的结局发生率亦十分罕见，结果的临床重要性则不高。

RD值的倒数为NNT (Number Needed to Treat) 值，常在研究中使用以呈现结局。NNT即需治数，指预防一例不良事件的发生或者增加一例有益结果需要治疗的病例数。这非常方便决策判断者选择干预。同上例，假设A与B的RD值之差为不良反应，则该结果的NNT为2000，即B相较于A，在相同情况下治疗了2000个患者才可以预防一例该不良反应。由于结果更为直观，方便决策者对干预措施进行选择。

二分类变量也可以包括有序数据。

有序数据（Ordinal data），其结局为多个分类的其中一种（如疾病严重程度），或者为累积的得分（如量表）。

在Meta分析中，长的有序数据通常被当成连续型数据进行分析，假设这些结果服从正态分布；短的有序数据则同通常被当成二分类数据进行分析，通过合并相邻的分类以得到最终分类数目为二。

例如，临床常用的疼痛评估量表，从0至10逐级反映疼痛程度，我们可以认为疼痛患者接受治疗后，疼痛程度降低为3的为无效治疗患者，这样我们就可以按照二分类变量的计算方法得出疼痛治疗的有效率，进行Meta分析。

然而，这种算法有两种弊端：

一方面，将多个类别的有序数据划分为两个类别的截断值的选择是主观的。因此，截断值的选择需要提供合理的依据，另外也可能需要进行敏感性分析判断截断值的选择是否影响Meta分析的结果。

另一方面，由于Meta分析取决于纳入的结果，所以当纳入的研究没有提供我们想要的截断方法，或者没有可以供我们截断有序数据为二分类数据的详细数据时，我们没有办法对该有序数据进行处理。

因此，Meta分析纳入研究时一般不对有序数据设限：纳入所有可以纳入的有序数据，依结果选择连续型变量处理还是二分类变量处理。

《医学科研口袋书》电子版是由LinkLab团队打造的一本专业实用的医学科研书籍，以现代流行病学(《Morden Epidemiology》)为基石，汇聚了来自哈佛、康奈尔及国内知名高校的临床科研工作者的实战经验汇编而成，全部都是干货文章。

获取方式：关注LinkLab微信公众号，微信搜索"LinkLab"即可，关注以后请将"邮箱地址"发送给公众号后台，我们会第一时间发给您。返回搜狐，查看更多

责任编辑：

【本文地址】

谈谈二分类变量

谈谈二分类变量

今日新闻

推荐新闻