AdaBoostClassifer详解及实战
Posted Data+Science+Insight
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了AdaBoostClassifer详解及实战相关的知识,希望对你有一定的参考价值。
AdaBoostClassifer详解及实战
AdaBoost算法是Adaptive Boost的简称,属于Boosting类算法。
随机森林是一种经典的Bagging算法。
Boosting通过将一系列弱学习器组合起来,通过集成这些弱学习器的学习能力,得到一个强学习器。具体到AdaBoost算法,AdaBoost在之前学习器的基础上改变样本的权重,增加那些之前被分类错误的样本的比重,降低分类正确样本的比重,这样之后的学习器将重点关注那些被分类错误的样本。最后通过将这些学习器通过加权组合成一个强学习器,具体的,分类正确率高的学习器权重较高,分类正确率低的学习器权重较低。
Adaboost作为一种提升集成算法,核心思想是不断训练弱学习器,来针对性的提升前一轮中预测错误样本的权重,最终通过加权所有弱学习器的训练结果得到最终分类标签。Adaboost是一种加权提升的集成算法,关键在于两个权重系数:
- 弱学习器权重,影响每个弱学习器的结果对最终集成学习结果的影响程度,与该学习器的错误率有关
- 样本权重,这也是Adaboost算法的精髓所在,即每轮训练弱学习器时不断优化调整样本间的权重,保证前一轮中学习错误的样本在下一轮训练中受到重点照顾
算法流程:
以上是关于AdaBoostClassifer详解及实战的主要内容,如果未能解决你的问题,请参考以下文章