基于随机森林算法完成鸢尾花卉品种预测任务 代码+数据

Posted 数学是算法的灵魂

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于随机森林算法完成鸢尾花卉品种预测任务 代码+数据相关的知识,希望对你有一定的参考价值。

1.理论部分

随机森林(Random Forest),顾名思义,就是由很多决策树模型融合在一起的算法。

随机森林是一种运用了集成学习(ensemble learning)的决策树分类器。

  • 随机森林是一种基于Bagging框架的模型融合算法,如图1.2所示。它通过多个基础的决策树模型进行训练,如何通过结合模块将多个分类器训练得到的结果进行融合最终得到预测结果
  • 随机森林的“森林”指的就是它的弱模型是由决策树算法训练的(具体是CART算法),CART算法既能做分类也能做回归(CART算法详情可见上述决策树章节)
  • 随机森林的“随机”指的是构造的若干个弱模型是有一定的“随机性”的

图1.2

1.1 随机森林的“随机”性体现在:

  • 子模型的训练样本是随机抽取的

图1.3

对于包含 n 个样本的数据集,我们先分n次随机有放回地采样出n个样本,组成采样集。由于是 n次有放回地采样,来自初始数据集的样本在这个采样集中,有的样本出现了多次,有的样本则从未出现(通过证明可得约有 63.2%的样本出现在采样

以上是关于基于随机森林算法完成鸢尾花卉品种预测任务 代码+数据的主要内容,如果未能解决你的问题,请参考以下文章

随机森林算法的Python实现

基于随机森林算法进行硬盘故障预测

RF预测基于matlab随机森林算法数据回归预测含Matlab源码 2047期

RF预测基于matlab随机森林算法数据回归预测含Matlab源码 2047期

随机森林算法梳理

动手实操丨基于随机森林算法进行硬盘故障预测