树模型及其提升方法

Posted bytedance

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了树模型及其提升方法相关的知识,希望对你有一定的参考价值。

树模型

  • 应用场景:1.分类   2.回归
  • 分类应用中的树模型等价于if-then规则的集合or定义在特征空间与类空间的条件概率分布,可解释性强
  • 概念:

1. 熵:表示随机变量的不确定程度,其数值越大,则随机变量的不确定性也越大

技术分享图片

2.条件熵:表示在已知随机变量X的条件下随机变量Y的不确定性,定义为X已知时随机变量Y的条件概率的熵对X的数学期望

技术分享图片

3.信息增益:表示已知特征X的信息而使得类Y的不确定性减少的程度 

g(Y,X)=H(Y)-H(Y|X)

4.信息增益比:解决信息增益

g_r(Y,X)=g(Y,X)/H(Y)

  • 实现:本质是特征选择问题

1. ID3 

 

以上是关于树模型及其提升方法的主要内容,如果未能解决你的问题,请参考以下文章

提升方法与梯度提升决策树

04-05 提升树

从提升树到 XGBoost, 原理简介

BoostingAdaboostAdaBoost模型的优缺点提升树梯度提升树GBDT

如何生产 XG 提升 / 决策树 / 随机森林模型

李航统计学习方法--8. 提升方法(详细推导)