R:任何可以控制树的最大深度的随机森林包?

Posted

技术标签:

【中文标题】R:任何可以控制树的最大深度的随机森林包?【英文标题】:R: any random forest packages in which the maximum depth of trees can be controlled? 【发布时间】:2017-03-26 07:09:06 【问题描述】:

我试图解决的特定问题需要我控制随机森林模型中的树的深度。最流行的 randomForest 包不允许用户精确控制最大深度。是否有任何控制最大深度的随机森林实现?

我正在处理一个大型数据集,因此速度也是一个考虑因素。

【问题讨论】:

如果您不依赖于特定的基于树的方法,那么 XgBoost 是一种梯度提升实现,可以控制最大深度。 【参考方案1】:

随机森林创建深树(与 XGBoost 和其他相比,这是它的一种东西)。那么,为什么要使用具有设定深度的随机森林呢?请参阅this question,了解为什么为随机森林设置最大深度是个坏主意。

此外,正如this SO question 中所讨论的,节点大小可以用作实际代理来控制每棵树生长到的最大深度。该链接还包含一些关于提高性能的 cmets。

【讨论】:

我想限制深度的原因是因为我只想看2路(或n路)分区。这里的目标不是提高预测能力。 那么你不想要随机森林。研究层次聚类或递归分区树。

以上是关于R:任何可以控制树的最大深度的随机森林包?的主要内容,如果未能解决你的问题,请参考以下文章

从随机森林模型中提取树的子集进行预测

将随机森林变成决策树 - 在 R 中使用 randomForest 包

随机森林修剪

在给定特征数量的情况下找到随机森林的最大深度

机器学习:R语言实现随机森林

随机森林中的树细节