Python机器学习:roc_curve()生成ROC曲线

Posted 紫昂张

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python机器学习:roc_curve()生成ROC曲线相关的知识,希望对你有一定的参考价值。

ROC曲线越接近纵轴,模型预测精度越高,能直观地表现模型精度。用sklearn里面的roc_curve()函数,就能一键计算FPR和TPR,快速生成ROC曲线啦。

 

先复习一下ROC曲线的构成:X轴代表假阳率,Y轴代表真阳率。我们要得到的值就是预测对的TPR、和预测错FPR的两组值。


模型准备:

思路是:先把模型训练好,生成测试集的结果y_test_proba备用。接着用roc_curve(),计算FPR和TPR,以及生成ROC曲线。

import lightgbm as lgb
model_lgb = lgb.LGBMClassifier().fit(X_train, y_train)
y_test_proba =  model_lgb.predict_proba(X_test)[:, 1]

ROC曲线的绘制:

import matplotlib.pyplot as plt
from sklearn.metrics import roc_curve

fpr, tpr, thresholds = roc_curve(y_test, y_test_proba)
plt.plot(fpr, tpr)

代码讲解:

matplotlib指绘图的包;

roc_curve是sklearn里面计算ROC曲线的函数,能返回FPR(假阳率)、TPR(真阳率)、和用于确定真正率和假正率的阈值;

fpr, tpr, thresholds 是我们自定义的参数名,分别用来存FPR(假阳率)、TPR(真阳率)、和用于确定真正率和假正率的阈值;

plot()能绘制点线图,把横轴FPR和纵轴TPR填进去就能生成ROC曲线啦。


运行结果:

 图形很接近真阳率TPR的纵轴,说明模型结果拟合得还不错。

以上是关于Python机器学习:roc_curve()生成ROC曲线的主要内容,如果未能解决你的问题,请参考以下文章

R语言使用yardstick包的roc_curve函数评估多分类(Multiclass)模型的性能查看模型在多分类每个分类上的ROC曲线(roc curve)

R语言使用DALEX包的explain函数生成指定分类预测机器学习模型的解释器

Python和R哪个更适合机器学习?

R语言使用knitr生成机器学习模型全流程步骤示例:knitr与自动化结果报告knitr常用参数

Azure Data Studio 机器学习 - 无法识别 Python 和 R 包

机器学习算法基础(Python和R语言实现)