统计学习方法

Posted 2020-10-06 哈哈哈

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了统计学习方法相关的知识，希望对你有一定的参考价值。

boosting 算法：通过改变训练样本的权重，学习多个分类器，并将多个分类器线性组合，提升分类性能。（对于一个复杂任务，将多个专家的判断进行适当的综合得出的判断，要比任一一个单独的判断好）将弱学习方法boost 为强学习算法。因为弱学习算法相对容易求得。提升算法就是从弱学习算法，出发反复学习，得到一系列弱分类器，然后组合为强分类器。

两个问题：

1. 如何改变训练数据的权重或概率分布

2. 如何将弱分类器组合

adaboost:

1. 提升前一轮弱分类器错误分类样本的权值，降低正确分类样本的权值

2. 加权多数表决方法，加大分类误差率小的弱分类器的权值，减小分类误差大的弱分类器的权值

adaboost 算法模型为加法模型，损失函数为指数函数，学习算法为前向分布算法时的二类分类学习方法。

boosting tree,

EM 算法：

用于含有隐变量的概率模型参数的极大似然估计，或极大后验估计。

分为两步： E步，求期望；M步求极大，

引入：概率模型有时既含有观测变量，又含有隐变量。如果概率模型的变量都是观测变量，那么给数据，可以直接用极大似然估计。