机器学习之roc曲线
Posted missed-forest
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习之roc曲线相关的知识,希望对你有一定的参考价值。
机器学习之ROC曲线
roc曲线全称受试者工作曲线,ROC曲线下面积就是AUC(Area under the curve),AUC用来衡量二分类机器学习算法的性能,即泛化能力
这里有几个概念,真阳性率,假阳性率,真阴性率,假阴性率,这四个率的产生是一个相对指标,即有一个参考标准,比如一个检测方法的金标准,
我用另一种方法检测,如下图所示
真(预测值) | 假(预测值) | |
---|---|---|
真(金标准) | 20 | 5 |
假(金标准) | 3 | 15 |
这个表里面我们分别来计算真阳性率和假阳性率(注意:所谓的真阳性率和假阳性率都是依据金标准来评判的)
比如真阳性率=实际预测并且正确的阳性数/真正的阳性数
=TP/(TP+FN)
=20/(20+5)
假阳性率=实际为假但是被预测为真/(实际为假但是被预测为真+真正为假并且预测为假的数)
=FP/(FP+TN)
=3/(3+15)
其中,真阳性率又叫做敏感度,真阴性率又叫特异性
所以有时候假阳性率也可以=1-真阴性率=1-特异度
总之,这里面的一切真阳性假阳性真阴性假阴性都是依据金标准来的
根据不同标准来得到不同的真阳性率,假阳性率的值,然后以假阳性率和真阳性率为横纵坐标做点,连接成折线图,就是ROC曲线
以上是关于机器学习之roc曲线的主要内容,如果未能解决你的问题,请参考以下文章
进阶版机器学习之模型性能度量及比较检验和偏差与方差总结(02)