随机森林和决策树调参

Posted 大猩猩的码基地

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了随机森林和决策树调参相关的知识,希望对你有一定的参考价值。

 

 

随机森林

随机森林的“随机”体现在两个部分:

  • 使用boostrap随机抽样(通俗点说就是有放回的随机抽样),假设原先数据集有N个样本,每次仍然抽出来N个样本,进行M次抽样,组成M个数据集(也就是抽M次,每次抽N个),每个单独的数据集都用来训练一颗单独的决策树T
  • 选取特征进行分裂的时候,随机选取 k 个特征(k是一个小于所有特征总数 P 的值),进行分裂

选取k值的时候,发明随机森林的人推荐如下的取值:

  • 回归:  k = √p
  • 分类: k = p/3

决策树

决策树停止分裂的常用条件:

1.树的深度到达指定最大值

2.损失函数已经到达指定的最小值

3.节点包含的样本数量已经到达指定的最小值

  • 回归: 5个
  • 分类: 1个

以上是关于随机森林和决策树调参的主要内容,如果未能解决你的问题,请参考以下文章

随机森林(Random Forest, RF)

随机森林在乳腺癌数据上的调参

scikit-learn随机森林调参小结

转载:scikit-learn随机森林调参小结

详解随机森林-随机森林在乳腺癌数据上的调参菜菜的sklearn课堂笔记

10、决策树集成--随机森林