机器学习准确率精确率召回率误报率漏报率概念及公式

Posted Better Bench

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习准确率精确率召回率误报率漏报率概念及公式相关的知识,希望对你有一定的参考价值。

阳性(正)样例P和阴性(负)样例N,将正样本预测为正样本的为True positive(TP),正样本预测为负样本的为False negativ(FN),负样本预测为正样本的为False positive(FP),负样本预测为负样本的为True negative(TN)。所以有:
P = T P + F N N = F P + T N P = TP+FN \\\\ N =FP+TN P=TP+FNN=FP+TN
1、准(正)确率accuracy
反映分类器或者模型对整体样本判断正确的能力,即能将阳性(正)样本positive判定为positive和阴性(负)样本negative判定为negative的正确分类能力。值越大,性能performance越好
A C C = T P + T N T P + T N + F P + F N ACC = \\fracTP +TNTP+TN+FP+FN ACC=TP+TN+FP+FNTP+TN

这里注意,在负样本占绝对多数的场景中,不能单纯追求准确率,因为将所有样本都判定为负样本,这种情况下准确率也是非常高的。
2、精确率precision
反映分类器或者模型正确预测正样本精度的能力,即预测的正样本中有多少是真实的正样本。值越大,性能performance越好
p r e c i s i o n = T P T P + F P precision = \\fracTPTP+FP precision=TP+FPTP

这里注意,单纯追求精确率,会造成分类器或者模型少预测为正样本,这时FP低,即精确率就会很高。
3、召回率recall,也称为真阳率、命中率(hit rate)
反映分类器或者模型正确预测正样本全度的能力,增加将正样本预测为正样本,即正样本被预测为正样本占总的正样本的比例。值越大,性能performance越好
r e c a l l = T P R = T P T P + F N = T P P recall =TPR= \\fracTPTP+FN = \\fracTPP recall=TPR=TP+FNTP=PTP
这里注意,单纯追求召回率,会造成分类器或者模型基本都预测为正样本,这时FN低,即召回率就会很高。
4、误报率false alarm,也称为假阳率、虚警率、误检率
反映分类器或者模型正确预测正样本纯度的能力,减少将负样本预测为正样本,即负样本被预测为正样本占总的负样本的比例。值越小,性能performance越好
f a l s e a l a r m = F P R = F P F P + T N = T P N falsealarm = FPR=\\fracFPFP+TN =\\fracTPN falsealarm=FPR=FP+TNFP=NTP

5、漏报率miss rate,也称为漏警率、漏检率
反映分类器或者模型正确预测负样本纯度的能力,减少将正样本预测为负样本,即正样本被预测为负样本占总的正样本的比例。值越小,性能performance越好
m i s s r a t e = F N R = F N T P + F N = F N P missrate = FNR = \\fracFNTP+FN = \\fracFNP missrate=FNR=TP+FNFN=PFN
6、特异度specificity
反映分类器或者模型正确预测负样本全度的能力,增加将负样本预测为负样本,即负样本被预测为负样本占总的负样本的比例。值越大,性能performance越好
s p e c i f i c i t y = T N R = T N F P + T N = T N N specificity = TNR = \\fracTNFP+TN = \\fracTNN specificity=TNR=FP+TNTN=NTN

以上是关于机器学习准确率精确率召回率误报率漏报率概念及公式的主要内容,如果未能解决你的问题,请参考以下文章

如何计算分层 K 折交叉验证的不平衡数据集的误报率?

准确率,精确度(AP)与召回率(AR)

准确率、精确率、召回率

精确率和召回率

针对二元分类机器学习模型中的准确率(Precision)召回率(Recall)F值(F-Measure)的学习

如何修复线性 SVM 的误报率?