为啥我的随机森林分类器模型中每棵决策树的 max_depth 都是一样的?

Posted

技术标签:

【中文标题】为啥我的随机森林分类器模型中每棵决策树的 max_depth 都是一样的?【英文标题】:Why the max_depth of every decision tree in my random forest classifier model are the same?为什么我的随机森林分类器模型中每棵决策树的 max_depth 都是一样的? 【发布时间】:2020-02-15 11:47:16 【问题描述】:

为什么我的随机森林分类器模型中每棵决策树的 max_depth 都是一样的? 我设置了我的 RandomForestClassifier 的 max_depth=30,当我打印每棵树时(trees = RandomForestClassifier.estimators_),我发现每棵树的 max_depth 都是一样的。

我真的不知道问题出在哪里以及它是如何发生的。

【问题讨论】:

如果可能,请提供一些代码示例和堆栈跟踪。 也许,您设置了min_samples_leaf 值,不允许增加深度 你最好提供代码,因为这个问题太笼统了 【参考方案1】:

如果我没记错的话,决策树可能会达到其最大深度。没有什么问题。我什至会说他一定会的。你允许你的树生长的空间,你的树将占据的空间。

缩放到随机森林,再次没有任何问题。您应该专注于选择正确的 max_depth,因为 max_depth 越大,过度拟合的风险就越大。

尝试不同的值并比较您对测试数据的处理方式。

【讨论】:

以上是关于为啥我的随机森林分类器模型中每棵决策树的 max_depth 都是一样的?的主要内容,如果未能解决你的问题,请参考以下文章

有没有办法从随机森林模型中提取树深度?

10、决策树集成--随机森林

随机森林中每棵树的平均绝对误差

决策树与随机森林

随机森林中每棵树的每个特征的特征重要性计算

如何在 Python scikit-learn 中输出随机森林中每棵树的回归预测?