决策树基本原理

Posted jaysonteng

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了决策树基本原理相关的知识,希望对你有一定的参考价值。

原理:

要对数据进行分类,涉及到通过选取什么样的特征对数据进行分类,比如将柚子和西瓜进行分类,可以选取(大小、颜色、甜度等特征)

决策树的功能就是判断使用哪个特征,然后选取他认为最好的特征对数据进行分类。

那么他是如何选取最好的特征呢?

就是通过信息熵来选取特征,求以每个特征来分类对应的信息熵(香农熵),选取信息熵最大的特征来作为分类依据。

不一定一次就能把数据进行分类(比如橘子和柠檬),可能需要不断地求当前数据的信息熵然后分类迭代下去。

 

优点:

1、计算复杂度不高

2、结果易于理解

3、对中间值确实不敏感

 

缺点:

可能会产生过度匹配问题

以上是关于决策树基本原理的主要内容,如果未能解决你的问题,请参考以下文章

CART回归树基本原理(具体例子)

ID3决策树算法|机器学习

决策树算法原理

SIGAI机器学习第六集 决策树

朴素贝叶斯分类器原理

决策树--从原理到实现