sklearn构建stacking模型进行堆叠多模型分层级回归分析

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了sklearn构建stacking模型进行堆叠多模型分层级回归分析相关的知识,希望对你有一定的参考价值。

sklearn构建stacking模型进行堆叠多模型分层级回归分析

 

See the source image

Stacking 就是当用初始训练数据学习出若干个基学习器后,将这几个学习器的预测结果作为新的训练集,来学习一个新的学习器。Stacking 的基础层通常包括不同的学习算法,因此stacking ensemble往往是异构的。

stacking的步骤:

假设有1000个样本,70%的样本作为训练集,30%的样本作为测试集。
STEP1:在训练集上采用算法A、B、C等训练出一系列基学习器。
STEP2:用这些基学习器的输出结果组成新的训练集,在其上训练一个元学习器(meta-classifier,通常为线性模型LR),用于组织利用基学习器的答案,也就是将基层模型的答案作为输入,让元学习器学习组织给基层模型的答案分配权重

 

# 在jupyter notebook中进行如下设置才会出现后续看到的精美的模型处理的结构流程图,

以上是关于sklearn构建stacking模型进行堆叠多模型分层级回归分析的主要内容,如果未能解决你的问题,请参考以下文章

集成学习-Stacking算法

随机森林原理与Sklearn参数详解

详解随机森林-概述菜菜的sklearn课堂笔记

matplotlib绘制带比例(percentile)的堆叠(stacked)条形图(bar plot)

华为堆叠stack-适合晋级者

numpy数组的堆叠:numpy.stack, numpy.hstack, numpy.vstack