LightGBM

Posted gaowenxingxing

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了LightGBM相关的知识,希望对你有一定的参考价值。

轻量级梯度提升模型

其相对 XGBoost 具有训练速度快、内存占用低的特点zhihu

网红XGBoost的缺点

  • 虽然利用预排序和近似算法可以降低寻找最佳分裂点的计算量,但在节点分裂过程中仍需要遍历数据集;
  • 预排序过程的空间复杂度过高,不仅需要存储特征值,还需要存储特征对应样本的梯度统计值的索引,相当于消耗了两倍的内存。

LightGBM做的改进

单边梯度抽样算法;
直方图算法;
互斥特征捆绑算法;
基于最大深度的 Leaf-wise 的垂直生长算法;
类别特征最优分割;
特征并行和数据并行;
缓存优化。

详细推理见机器学习与自然语言处理

我先去看看大神们通俗易懂的讲解,回头补充,一上来就看推导,脑壳痛~~

以上是关于LightGBM的主要内容,如果未能解决你的问题,请参考以下文章