决策树 ID3方法

Posted lalalatianlalu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了决策树 ID3方法相关的知识,希望对你有一定的参考价值。

ID3的决策树中主要使用了香农熵的概念,熵表示了数据的混乱程度,熵的值越大表示混乱程度越大

熵的计算公式为 H = -∑p(xi)log(P(xi)),表示P(xi)表示xi这种情况出现的概率

每次对于特征的选择流程如下,先求出原本数据集的熵值,然后对于每个特征,以此特征作为分类标准之后再进行剩余数据集的熵值,用max(原本数据集的熵值 - 当前数据集的熵值),每次找到最大值进行划分

以上是关于决策树 ID3方法的主要内容,如果未能解决你的问题,请参考以下文章

鹅厂优文 | 决策树及ID3算法学习

决策树 ID3方法

day-8 python自带库实现ID3决策树算法

机器学习 | 决策树ID3算法

机器学习 | 决策树ID3算法

决策树分类算法(ID3)