交叉验证分析每一折(fold of Kfold)验证数据的评估指标并绘制综合ROC曲线

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了交叉验证分析每一折(fold of Kfold)验证数据的评估指标并绘制综合ROC曲线相关的知识,希望对你有一定的参考价值。

交叉验证分析每一折(fold of Kfold)验证数据的评估指标并绘制综合ROC曲线

Receiver Operating Characteristic (ROC) with cross validation

Receiver operating characteristic example

使用交叉验证评价分类器输出质量的接收机工作特征(ROC)度量示例。

ROC曲线的典型特征是Y轴为真阳性率,X轴为假阳性率。这意味着图的左上角是“理想”点——假阳性率为零,真阳性率为1。这不是很现实,但它确实意味着曲线下更大的区域(AUC)通常更好。

ROC曲线的“陡度”也很重要,因为理想的做法是最大化真阳性率,同时最小化假阳性率。

这个例子显示了不同数据集的ROC响应,由K-fold交叉验证创建。取所有这些曲线,就可以计算出曲线下的平均面积,并看到训练集被分割成不同子集时曲线的方差。这大致显示了分类器输出如何受到训练数据变化的影响,以及K-fold交叉验证产生的分割是如何不同。

 

# 参考模板,sklearn example

import numpy as np
import matplotlib.pyplot as plt

from sklearn import svm, datasets
from sklearn.metrics import auc
from sklearn.metrics import plot_roc_curve
from sklearn.model_selection import StratifiedKFold

# ##################################################

以上是关于交叉验证分析每一折(fold of Kfold)验证数据的评估指标并绘制综合ROC曲线的主要内容,如果未能解决你的问题,请参考以下文章

R语言使用yardstick包的conf_mat函数计算多分类(Multiclass)模型在每个交叉验证(或者重采样)的每一折fold上的混淆矩阵并使用summary输出每个fold的其它详细指标

Python使用tpot获取最优模型将最优模型应用于交叉验证数据集(5折)获取数据集下的最优表现,并将每一折(fold)的预测结果概率属于哪一折与测试集标签结果概率一并整合输出为结果文件

R语言使用yardstick包的roc_auc函数评估多分类(Multiclass默认为macro自定义设置micro)模型的性能查看模型在每个交叉验证(重采样)的每一折fold上的AUC指标

R语言使用yardstick包的rmse函数评估回归模型的性能评估回归模型在每个交叉验证(或者重采样)的每一折fold上的RMSE以及整体的均值RMSE(其他指标maemape等计算方式类似)

R语言使用yardstick包的gain_curve函数评估多分类(Multiclass)模型的性能并使用autoplot函数可视化模型在每个交叉验证(或者重采样)的每一折fold在每个分类上的增益

R语言使用yardstick包的pr_curve函数评估多分类(Multiclass)模型的性能并使用autoplot函数可视化模型在每个交叉验证(或者重采样)的每一折fold在每个分类上的PR曲线