用Scikit-learn实现分类指标评价
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用Scikit-learn实现分类指标评价相关的知识,希望对你有一定的参考价值。
参考技术A 1、混淆矩阵(Confuse Matrix)2、准确率(Accuracy) 准确率是常用的一个评价指标,但是不适合样本不均衡的情况。
3、精确率(Precision) 又称查准率,正确预测为正样本(TP)占预测为正样本(TP+FP)的百分比。
4、召回率(Recall) 又称为查全率,正确预测为正样本(TP)占正样本(TP+FN)的百分比。
5、F1 Score 精确率和召回率是相互影响的,精确率升高则召回率下降,召回率升高则精确率下降,如果需要兼顾二者,就需要精确率、召回率的结合F1_Score。
F1−Score=2/(1/Precision+1/Recall)
6、P-R曲线(Precision-Recall Curve) P-R曲线是描述精确率和召回率变化的曲线
7、ROC(Receiver Operating Characteristic)
ROC空间将假正例率(FPR)定义为 X 轴,真正例率(TPR)定义为 Y 轴。
TPR:在所有实际为正例的样本中,被正确地判断为正例之比率。
FPR:在所有实际为负例的样本中,被错误地判断为正例之比率。
8、AUC(Area Under Curve)
AUC(Area Under Curve)被定义为 ROC曲线下与坐标轴围成的面积,显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围在0.5和1之间。AUC越接近1.0,检测方法真实性越高;等于0.5时,则真实性最低,无应用价值。
1、KS(Kolmogorov-Smirnov) KS统计量由两位苏联数学家A.N. Kolmogorov和N.V. Smirnov提出。在风控中,KS常用于评估模型区分度。区分度越大,说明模型的风险排序能力(ranking ability)越强。 K-S曲线与ROC曲线类似,不同在于:
KS不同代表的不同情况,一般情况KS值越大,模型的区分能力越强,但是也不是越大模型效果就越好,如果KS过大,模型可能存在异常,所以当KS值过高可能需要检查模型是否过拟合。以下为KS值对应的模型情况,但此对应不是唯一的,只代表大致趋势。
机器学习100天(二十二):022 分类模型评价指标-Python实现
机器学习100天!今天讲的是:分类模型评价指标-Python实现!
《机器学习100天》完整目录:目录
打开spyder,首先,导入标准库。
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import recall_score
from sklearn
以上是关于用Scikit-learn实现分类指标评价的主要内容,如果未能解决你的问题,请参考以下文章
机器学习100天(二十二):022 分类模型评价指标-Python实现