用于分类问题的 RandomForestRegressor
Posted
技术标签:
【中文标题】用于分类问题的 RandomForestRegressor【英文标题】:RandomForestRegressor for classification problems 【发布时间】:2020-04-24 02:56:06 【问题描述】:我一直在 Coursera 和第 4 周的作业中学习 Python 应用机器学习课程,我发现了一些有趣的东西。在我第一次尝试完成作业时,我尝试使用 sklearn 中的 RandomForestClassifier 来预测标签,但该模型过度拟合并且显示出较差的测试准确度结果。作为一个实验,我切换到了 RandomForestRegressor,你猜怎么着,它不仅没有过度拟合,而且测试准确率也高了很多。那么,为什么 RandomForestRegressor 在二元分类问题上的表现要好得多?
【问题讨论】:
您如何将回归值转换为标签? 模型预测的所有值都在 0 和 1 之间。它是某种默认设置 【参考方案1】:在集成决策树时,随机森林回归器确实与随机森林分类器有所不同:
分类器使用决策树预测类别的模式 回归器使用决策树预测值的平均值由于这种差异,模型可能会产生不同的结果。在某些情况下,这可能会导致回归器的性能优于分类器。
除此之外,我想说的是,如果您正确调整超参数,分类器在分类问题上的表现应该比回归器更好。
【讨论】:
以上是关于用于分类问题的 RandomForestRegressor的主要内容,如果未能解决你的问题,请参考以下文章