机器学习100天（二十）：020 分类模型评价指标-PR曲线

Posted 2023-01-02 红色石头Will

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了机器学习100天（二十）：020 分类模型评价指标-PR曲线相关的知识，希望对你有一定的参考价值。

机器学习100天！今天讲的是：分类模型评价指标-PR曲线！

上一节我们已经了解了混淆矩阵的概念，并掌握了精确率、召回率的计算公式，在这里。现在我们来学习 PR 曲线的概念。

如图中所示，P-R 曲线的 P 就是精确率（也称为查准率），R 就是召回率（也称为查全率）。以查全率作为横坐标，查准率作为纵坐标。对于同一个模型，通过调整分类阈值，可以得到不同的 P-R 值。这里的阈值就是判断正类的概率阈值，例如 0.5、0.8、0.3 等。不同的阈值，计算得到不同的 P 值和 R 值，然后将所有不同阈值下的 P-R 坐标点连接起来，就得到了 P-R 曲线。通常随着分类阈值从大到小变化，查准率减小，查全率增加。

比较两个分类器好坏时，显然是查得又准又全的比较好，也就是说 PR 曲线越往坐标（1，1）的位置靠近越好。若一个学习器的 P-R 曲线被另一个学习器完全”包住”，则后者的性能优于前者。如果存在交叉时，可以计算曲线与两个坐标轴围住的面积，面积越大，表明模型越好！也可以通过平衡点（即查准率=查全率的点，P-R 曲线与这条虚线的交点，称为 Break-Even Point，BEP）来判断。BEP 越靠近坐标（1，1），则模型越好。

在图中，基于 BEP 的比较，可以认为模型 A 优于模型 B 和模型 C 的。

好了，今天的内容到此结束！

以上是关于机器学习100天（二十）：020 分类模型评价指标-PR曲线的主要内容，如果未能解决你的问题，请参考以下文章