如何计算决策树的 AUC?

Posted

技术标签:

【中文标题】如何计算决策树的 AUC?【英文标题】:How does AUC of decision tree being calculated? 【发布时间】:2014-04-15 19:38:47 【问题描述】:

假设我有一个只有一个连续变量的数据集,我尝试使用决策树算法构建一个模型,从数据集中对 +ve 和 -ve 标签进行分类。我运行 10 倍交叉验证。

如何为决策树分类器计算 AUC?算法会检查分类器的不同阈值,并确定AUC吗?

如果我有超过 2 个连续变量呢?

谢谢!

【问题讨论】:

属于 stats.stackexchange.com。与编程无关。 【参考方案1】:

题外话,但是嘿:

AUC 仅对二元分类有意义。预测变量的数量无关紧要。

决策树本身没有“阈值”,但通常在分类问题中,叶子包含 2 个类别的概率分布,树的预测也是如此。因此,您可以设想只有当概率 >= p 而不仅仅是 >= 0.5 时才选择正类。然后你可以画一条AUC曲线。

因此将其应用于决策树有点不自然,但可以做到。

【讨论】:

p可以是那个阈值吗? 是的,我就是这个意思! 谢谢!我明白了~

以上是关于如何计算决策树的 AUC?的主要内容,如果未能解决你的问题,请参考以下文章

如何获得决策树的 ROC 曲线?

scikit-learn 中决策树中的 AUC 计算

如何计算决策树的泛化错误率

决策树算法

如何在 xgboost 中访问单个决策树的权重?

决策树方法的基本思想是啥