机器学习性能评估指标

Posted 4privetdrive

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习性能评估指标相关的知识,希望对你有一定的参考价值。

机器学习性能评估指标

TP、TN、FP、FN

FN:False(假的) Negative(反例),模型判断样本为负例,但模型判断错了,事实上是正样本。(漏报率)
FP:False(假的) Positive(正例),模型判断样本为正例,但模型判断错了,事实上是负样本。(误报率)
TN:True(真的) Negative(负例),模型判断样本为负例,事实上也是负样本,模型的判断是对的。
TP:True(真的) Positive(正例),模型判断样本为正例,事实上也是正样本,模型判断是对的。

 

Precision

中文叫做精确率/查准率,表示模型认为的正例(TP+FP)中,真正判断正确的比例。

$$P=frac{TP}{TP+FP}$$

 

Recall

中文叫做召回率/查全率,表示样本真实的正例(TP+FN)中,真正判断正确的比例。

$$frac{TP}{TP+FN}$$

 

P-R曲线

以查准率为纵轴,以查全率为横轴画出来的曲线。

 技术图片

 

 

 

F-Measure

是精确率和召回率的调和平均

$$F=frac{(alpha^{2}+1)P*R}{alpha^{2}(P+R)}$$

当$alpha=1$时,记为F1指标:

$$F1=frac{2PR}{P+R}$$

 

ROC、AUC

ROC曲线是评价学习器泛化能力的指标,他纵轴是“真正例率”(TPR),横轴是“假正例率”(FPR)

TPR = TP / (TP + FN)

FPR = FP / (TN + FP)

AUC,就是area under ROC curve,ROC曲线下包裹的面积。

技术图片

以上是关于机器学习性能评估指标的主要内容,如果未能解决你的问题,请参考以下文章

机器学习性能评估指标

机器学习评估方法及性能度量

R使用交叉验证(cross validation)进行机器学习模型性能评估

Python机器学习:6.6 不同的性能评价指标

机器学习算法分类及其评估指标

机器学习中的评价指标