Python机器学习:roc_curve()生成ROC曲线
Posted 紫昂张
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python机器学习:roc_curve()生成ROC曲线相关的知识,希望对你有一定的参考价值。
ROC曲线越接近纵轴,模型预测精度越高,能直观地表现模型精度。用sklearn里面的roc_curve()函数,就能一键计算FPR和TPR,快速生成ROC曲线啦。
先复习一下ROC曲线的构成:X轴代表假阳率,Y轴代表真阳率。我们要得到的值就是预测对的TPR、和预测错FPR的两组值。
模型准备:
思路是:先把模型训练好,生成测试集的结果y_test_proba备用。接着用roc_curve(),计算FPR和TPR,以及生成ROC曲线。
import lightgbm as lgb
model_lgb = lgb.LGBMClassifier().fit(X_train, y_train)
y_test_proba = model_lgb.predict_proba(X_test)[:, 1]
ROC曲线的绘制:
import matplotlib.pyplot as plt
from sklearn.metrics import roc_curve
fpr, tpr, thresholds = roc_curve(y_test, y_test_proba)
plt.plot(fpr, tpr)
代码讲解:
matplotlib指绘图的包;
roc_curve是sklearn里面计算ROC曲线的函数,能返回FPR(假阳率)、TPR(真阳率)、和用于确定真正率和假正率的阈值;
fpr, tpr, thresholds 是我们自定义的参数名,分别用来存FPR(假阳率)、TPR(真阳率)、和用于确定真正率和假正率的阈值;
plot()能绘制点线图,把横轴FPR和纵轴TPR填进去就能生成ROC曲线啦。
运行结果:
图形很接近真阳率TPR的纵轴,说明模型结果拟合得还不错。
以上是关于Python机器学习:roc_curve()生成ROC曲线的主要内容,如果未能解决你的问题,请参考以下文章
R语言使用yardstick包的roc_curve函数评估多分类(Multiclass)模型的性能查看模型在多分类每个分类上的ROC曲线(roc curve)
R语言使用DALEX包的explain函数生成指定分类预测机器学习模型的解释器
R语言使用knitr生成机器学习模型全流程步骤示例:knitr与自动化结果报告knitr常用参数