为啥需要从随机森林的数据中随机选择样本？

Posted 2023-03-12

技术标签:

【中文标题】为啥需要从随机森林的数据中随机选择样本？【英文标题】：Why there is need to randomly select the samples from data in random forest?为什么需要从随机森林的数据中随机选择样本？ 【发布时间】：2019-01-01 02:15:56 【问题描述】：

我们还可以通过随机选择特征，从相同的数据中形成不同的决策树，而无需创建如此多的样本。

【问题讨论】：

“创建这么多样本”是什么意思？ RF 中没有创建样本实际上，在 RF 中我们两者都做（即随机选择数据和特征）；这里的答案可能有用：Why is Random Forest with a single tree much better than a Decision Tree classifier? 【参考方案1】：

选择数据的随机子集是一种确保每棵树不会过度拟合基础数据的方法

【讨论】：

以上是关于为啥需要从随机森林的数据中随机选择样本？的主要内容，如果未能解决你的问题，请参考以下文章