ROC曲线的绘制过程/AUC/TPR、FPR、敏感度和特异度 |
您所在的位置:网站首页 › matlab求曲线最大值和横坐标的关系 › ROC曲线的绘制过程/AUC/TPR、FPR、敏感度和特异度 |
在选择诊断试验时,一些研究学者会在灵敏度和特异度的取舍之间徘徊。那么,是否可以综合灵敏度和特异度之间的特点,选择一个指标来评价诊断实验之间的准确性呢?Lusted在1971年提出了受试者工作特征曲线(receiver operating characteristic curve,简称ROC曲线),用来描述诊断试验的内在真实度,应用十分广泛。 1 ROC曲线ROC曲线是以假阳性概率(False positive rate,FPR,1-特异度)为横轴,真阳性(True positive rate,TPR,灵敏度)为纵轴所组成的坐标图,和受试者在特定刺激条件下由于采用不同的判断标准得出的不同结果画出的曲线。传统的诊断试验评价方法有一个共同的特点,必须将试验结果分为两类,再进行统计分析。ROC曲线的评价方法与传统的评价方法不同,无须此限制,而是根据实际情况,允许有中间状态,可以把试验结果划分为多个有序分类,如正常、大致正常、可疑、大致异常和异常五个等级再进行统计分析。因此,ROC曲线评价方法适用的范围更为广泛。 2 ROC曲线绘制在绘制ROC曲线之前,首先要理解一下True Positive(TP), False Positive(FP), True Negative(TN), False Negative(FN)的概念: 预测值为正例,记作P(Positive)预测值为负例,记作N(Negative)预测值与真实值相同,记为T(True)预测值与真实值相反,记为F(False)混淆矩阵: 由此,引入真正率(True Positive Rate)和假正率(False Positive Rate)的概念: TPR:被分为正类的正样本的比例 T P R = T P T P + F N TPR=\frac{TP}{TP+FN} TPR=TP+FNTPFPR:被分为正类的负样本的比例 F P R = F P F P + T N FPR=\frac{FP}{FP+TN} FPR=FP+TNFP此外,还有一个概念叫”截断点”。机器学习算法对test样本进行预测后,可以输出各test样本对某个类别的相似度概率。比如t1是P类别的概率为0.3,一般我们认为概率低于0.5,t1就属于类别N。这里的0.5,就是”截断点”。 总结一下,对于计算ROC,最重要的三个概念就是TPR, FPR, 截断点。 截断点不同计算出来的TPR和FPR也不同。将截断点不同取值下对应的TPR和FPR结果画于二维坐标系中得到的曲线,就是ROC曲线。横轴用FPR表示,纵轴用TPR表示。 下面看一个例子来具体了解一下如何绘制ROC曲线。 根据分类器的概率预测结果对样例排序,并按此顺序依次选择不同的“截断点",逐个把样例作为正例进行预测。每次计算出当前分类器的”真正率"和“假正率”,然后分别以它们为纵轴和横轴画图,就可以得到ROC曲线。
|
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |