调整命中后的预测概率

Posted

技术标签:

【中文标题】调整命中后的预测概率【英文标题】:Adjust predicted probability after smote 【发布时间】:2019-11-21 16:52:19 【问题描述】:

我有一个不平衡数据集,我使用 smote 对少数类进行过采样,对多数类进行欠采样。 现在,我想使用模型的 predict_proba 检查测试 AUC。

我有两个问题: 1. 如果我在比较 AUC,我是否必须更正概率? 2.我该如何纠正它(欠采样和过采样的组合!)

【问题讨论】:

【参考方案1】:

(1) 好消息是,在比较 AUC 时您不必更正。重采样校正是未校正分数的严格递增函数,因此不会改变事例的顺序,因此ROC完全相同。

(2) 欠采样/过采样后有一个简单的校正公式,我忘了它是什么,我很确定网络搜索会找到它。

进一步讨论最适合 stats.stackexchange.com。

【讨论】:

以上是关于调整命中后的预测概率的主要内容,如果未能解决你的问题,请参考以下文章

具有概率目标的决策树

SVM 模型将概率分数大于 0.1(默认阈值 0.5)的实例预测为正例

XGB:展示每个预测结果的各特征概率

神经网络输出预测及其概率

预测方法显示标准化概率?

在 Spark RandomForestClassifier 中预测类概率