为什么极度随机树比随机森林更随机?这个极度随机的特性有什么好处?在训练阶段极度随机数比随机森林快还是慢?

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了为什么极度随机树比随机森林更随机?这个极度随机的特性有什么好处?在训练阶段极度随机数比随机森林快还是慢?相关的知识,希望对你有一定的参考价值。

为什么极度随机树比随机森林更随机?这个极度随机的特性有什么好处?在训练阶段、极度随机数比随机森林快还是慢?

See the source image

 

ExtRa Trees是Extremely Randomized Trees的缩写,意思就是极度随机树。极端随机树,简称ExtRa Trees,是一种集成机器学习算法。具体地说,它是一个决策树的集成学习方法,并与其他决策树集成算法相关,如bagging和随机森林(random  forest)。

极度随机树比常规随机森林更具有随机性(Randomness),因为该模型在每次分裂或者分枝的时都会随机选择一个特征子集进行分枝特征的选择,而且该模型不需要选择最佳阈值,而是采用随机阈值进行分枝。

也就是说,ExtRa Trees算法在每个节点随机选择和一个特征子集,并且随机分裂来获取最优的分枝属性和分枝阈值(随机森林是有固定的个数的特征子集进行最优分裂);


这种增加的随机性有助于创建更多彼此独立的决策树(各个子决策树约独立,综合的效果就越符合大数定律),并有助于训练一个好的集成学习模型。

极度随机树比常规随机林模型训

以上是关于为什么极度随机树比随机森林更随机?这个极度随机的特性有什么好处?在训练阶段极度随机数比随机森林快还是慢?的主要内容,如果未能解决你的问题,请参考以下文章

旋转随机森林算法

随机森林(Random Forest)

随机森林回归器的特征选择

随机森林

随机森林

利用随机森林对特征重要性进行评估