机器学习实战笔记(Python实现)-07-分类性能度量指标

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习实战笔记(Python实现)-07-分类性能度量指标相关的知识,希望对你有一定的参考价值。

1、混淆矩阵

下图是一个二类问题的混淆矩阵,其中的输出采用了不同的类别标签

技术分享

常用的衡量分类性能的指标有:

  • 正确率(Precision),它等于 TP/(TP+FP) ,给出的是预测为正例的样本中的真正正例的比例。
  • 召回率(Recall),他等于 TP/(TP+FN),给出的是预测为正例的真实正例占所有真实正例的比例。

2、ROC曲线 

技术分享

 

图中的横轴是伪正例的比例(假阳率=FP/(FP+TN)),而纵轴是真正例的比例(真阳率=TP/(TP+FN))。ROC曲线给出的是当阈值变化时假阳率和真阳率的变化情况。左下角的点所对应的是将所有样例判为反例的情况,而右上角的点对应的则是将所有样例判为正例的情况。虚线给出的是随机猜测的结果曲线。

对不同的ROC曲线进行比较的一个指标是曲线下的面积(Area Unser the Curve)。AUC给出的是分类器的平均性能值,当然它并不能完全代替对整条曲线的观察。一个完美分类器的AUC为1.0,而随机猜测的AUC则为0.5。 

 

 

THE END.

 

以上是关于机器学习实战笔记(Python实现)-07-分类性能度量指标的主要内容,如果未能解决你的问题,请参考以下文章

Python3《机器学习实战》学习笔记

学习打卡07 可解释机器学习笔记之Shape+Lime代码实战

学习打卡07 可解释机器学习笔记之Shape+Lime代码实战

学习打卡07 可解释机器学习笔记之Shape+Lime代码实战

学习打卡07 可解释机器学习笔记之Shape+Lime代码实战

机器学习实战笔记(Python实现)-01-K近邻算法(KNN)