如何计算决策树的 AUC?
Posted
技术标签:
【中文标题】如何计算决策树的 AUC?【英文标题】:How does AUC of decision tree being calculated? 【发布时间】:2014-04-15 19:38:47 【问题描述】:假设我有一个只有一个连续变量的数据集,我尝试使用决策树算法构建一个模型,从数据集中对 +ve 和 -ve 标签进行分类。我运行 10 倍交叉验证。
如何为决策树分类器计算 AUC?算法会检查分类器的不同阈值,并确定AUC吗?
如果我有超过 2 个连续变量呢?
谢谢!
【问题讨论】:
属于 stats.stackexchange.com。与编程无关。 【参考方案1】:题外话,但是嘿:
AUC 仅对二元分类有意义。预测变量的数量无关紧要。
决策树本身没有“阈值”,但通常在分类问题中,叶子包含 2 个类别的概率分布,树的预测也是如此。因此,您可以设想只有当概率 >= p 而不仅仅是 >= 0.5 时才选择正类。然后你可以画一条AUC曲线。
因此将其应用于决策树有点不自然,但可以做到。
【讨论】:
p可以是那个阈值吗? 是的,我就是这个意思! 谢谢!我明白了~以上是关于如何计算决策树的 AUC?的主要内容,如果未能解决你的问题,请参考以下文章