机器学习算法集成学习-1 强学习器的融合学习

Posted 2022-08-06 晴天qt01

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了机器学习算法集成学习-1 强学习器的融合学习相关的知识，希望对你有一定的参考价值。

目录

集成学习*

前言引入：

集成学习概述

模型融合（强学习器融合）概述

模型融合方法：

多数法

平均法：

加权平均法。

堆叠法：

混合法：

总结：

我的主页：晴天qt01的博客_CSDN博客-数据分析师领域博主

目前进度：第四部分【机器学习算法】

集成学习*

前言引入：

我们购买新车的时候会走进一家汽车店，然后按照经销商的建议购买吗？这应该不大可能。

更多的时候是浏览一些网站，比较不同的车型，功能，和价格，也可能问问朋友和同事，。我们下结论都是考虑他人的意见，然后下决定

机器学习中的集成学习模型就是类似的想法。

他们将多个模型的决策结合起来，提高预测结果。

案例：

假如你是一个电影的导演，你已经创作了一部非常重要且有趣的话题电影，你现在希望得到他人对电影的评价，反馈。你有什么方法呢

让一位好朋友给你评分。

你的好朋友可能会考虑到你们的关系，不会给你糟糕的电影提供1星评分刺伤你的心。

你可以让5位同事评价电影。

这应该是比上一个选择好许多的方法，可以更好了解电影的评级，比较诚实的评级。但是这5个人里面不一定是最佳的裁判

你可以让50个人评价你的电影。

有一些人是你的朋友，有一些人可能是你的同事，一些可能是完全陌生的。这种情况的回答普遍会更加的多元化，因为你拥有不同技能的人，事实证明，这是获得最佳评价的方法。

多个决策者比一个决策者可能会做出更好的决策，各种模型的整合也是如此，机器学习这种多样化就是通过集成学习的技术实现的

集成学习模型通过将多个学习器进行组合，常可获取比单一学习器更好的泛化能力

集成学习的方法在全球各大机器学习、数据挖掘竞赛中使用的非常广泛，其概念和思想也是风靡学术界和工业界。

如果要对其进行分类，可以大致划分为：

模型融合

机器学习元算法

模型融合是一个再学习的过程，将训练出的强学习器（比如把朴素贝叶斯，神经网络，SVM，逻辑回归，这些算法都竭尽所能的把数据进行分类。）组合起来进一步提高性能，也就是把不同的专家意见组合起来继续预测。

机器学习元算法，是属于弱学习器的算法。可能算法只有一种，通过不同的训练数据，用相同的算法（一种算法），进行预测结果的组合，当做我们的预测模型。从原始数据抽样模型的。

集成学习概述

集成学习的种类。

模型融合（强学习器）

多数法，平均法，加权平均法（前3个比较简单），堆叠法（stacking），混合法（Blending）

机器学习元算法（弱学习器）：

袋装法：（bagging）

袋装通用法

随机森林

提升法

ADAboost

XGBoost

Gradient Boost

模型融合（强学习器融合）概述

模型融合的思想也很符合大多数人的直觉

训练出多个功能强大的学习器

为了提高学习器的能力，把几个学习器组合起来。

模型融合的

好处：增强了模型的预测以及泛化能力

坏处：多模型的学习加上再学习会显著的增加计算的代价（也就是耗费时间）

我们在训练数据得到的模型进行融合，如果它们好坏参差不齐，那么集成模型的性能可能会比好的坏一些，坏的好一些

不过在测试数据中，泛化能力比较好。也就是稳定性比较高。

所以我们什么时候才能让它得到泛化能力最好，我们需要每个“学习器”好而不同。

好而不同是什么：就是比如现在要把10笔数据进行分堆，可能naïve bayes分对了5个，神经网络分对了后5个，就是分错的数据不要是同一堆，一致的话融合就没有用，分错的数据不一致，还准确率都还不错，那么合并起来之后。如果每个学习器都好，而且准确率都不错的前提下，我们会取概率大的来猜，那么模型融合就可以做到更好，决策的更精准。

好是代表性能好，不同是代表模型分类类别不同。