决策树学习

Posted dahu的菜园子

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了决策树学习相关的知识,希望对你有一定的参考价值。

 id3  信息增益

c4.5  信息增益比

CART  基尼指数

 

参考  

优缺点:  决策树算法原理 (上)   决策树算法原理 (下)

简略介绍:   [Machine Learning & Algorithm] 决策树与迭代决策树(GBDT)

1.熵的概念

首先,我们需要熟悉信息论中熵的概念。熵度量了事物的不确定性,越不确定的事物,它的熵就越大。具体的,随机变量 X 的熵的表达式如下:

熟悉了一个变量 X 的熵,很容易推广到多个个变量的联合熵,这里给出两个变量 X 和 Y 的联合熵表达式:

有了联合熵,又可以得到条件熵的表达式 H(X|Y),条件熵类似于条件概率, 它度量了我们的 X 在知道 Y 以后剩下的不确定性。表达式如下:

 

以上是关于决策树学习的主要内容,如果未能解决你的问题,请参考以下文章

机器学习——决策树,DecisionTreeClassifier参数详解,决策树可视化查看树结构

机器学习-------决策树算法

机器学习决策树

机器学习笔记五 决策树

《机器学习》第三章 决策树学习 笔记加总结

机器学习算法学习02:决策树的学习以及应用决策树解决Cora数据集论文分类问题