模型评估PR|ROC|AUC

Posted zhaopac

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了模型评估PR|ROC|AUC相关的知识,希望对你有一定的参考价值。

这里主要讲的是对分类模型的评估。

1、准确率(Accuracy)

    准确率的定义是:【分类正确的样本】 / 【总样本个数】,其中分类正确的样本是不分正负样本的

    优点:简单粗暴

    缺点:当正负样本分布不均衡的情况(假设一种极端情况,正样本1个,负样本99个),此时即使一个比较差的模型(只会将所用的样本预测成负样本),那它也有99%的准确率。

             总结一下就是 当样本分布不均匀,该指标意义不大

    改进方案: 1、在不同样本分类下求它的准确率,然后取平均值

                    2、选取其他评价指标

2、PR曲线

    Precision(精准率):【分类正确的正样本个数】/【被预测为正样本的个数】

    Recall(召回率):【分类正确的正样本个数】/【真实中正样本的个数】

    Precision 与 Recall是一对既矛盾又统一的变量

    矛盾是指:如果想要高的 精准率,也就要求模型要非常强,强到 预测为正样本的样本 全部都是正确的,此时Precision=1,而

    统一是指:

 

以上是关于模型评估PR|ROC|AUC的主要内容,如果未能解决你的问题,请参考以下文章

使用sklearn画二分类模型ROC曲线,PR曲线

模型评估:ROC与AUC

分类模型评估之ROC-AUC曲线和PRC曲线

机器学习--模型评估指标之混淆矩阵,ROC曲线和AUC面积

R语言构建logistic回归模型并评估模型:模型预测结果抽样可视化模型分类预测的概率分布情况使用WVPlots包绘制ROC曲线并计算AUC值

推荐系统之评估方法和评价指标PR、ROC、AUC