用是否买房为例来说明决策树算法的使用-AI机器学习

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用是否买房为例来说明决策树算法的使用-AI机器学习相关的知识,希望对你有一定的参考价值。

我们以是否买房为例子给大家介绍一下决策树算法的使用,数据集如下(仅做演示,不代表真实情况)

地段

近地铁

面积

单价(万)

是否购买

三环

60

8

三环

80

8

三环

60

7

三环

80

7

五环

60

7

五环

80

7

五环

60

6

五环

80

6

六环

60

6

六环

80

5.5

六环

60

5

六环

80

5

从上表中我们可以看到,确定可以购买的数量有7个,不购买的数量有5个,共数是12个。按信息熵的计算公式我们可以得出此数据集的信息熵为:

技术分享图片

按地段(用A1表示)划分,三环(D1),五环(D2),六环(D3),来计算信息增益

技术分享图片

按是否近地铁(用A2表示)划分,是(D1),否(D2), 来计算信息增益

技术分享图片

按面积(用A3表示)划分,60平(D1),80平(D2), 来计算信息增益

技术分享图片

按单价划分(用A4表示),5w(D1), 5.5w(D2), 6w(D3), 7w(D4), 8w(D5) , 来计算信息增益

技术分享图片

通过以上结果我们可以知道,对于信息熵的降低量(就是说人们决定是否买房的决定因素的权重)由高到低分别为:单价、面积、地段、是否近地铁

以上算法就是决策树算法中ID3算法所采用的逻辑。

注:数量仅作为演示用的测试数据,不代表真实决策依据。


关注微信公众号“挨踢学霸”,获取更多人工智能技术文章

技术分享图片

以上是关于用是否买房为例来说明决策树算法的使用-AI机器学习的主要内容,如果未能解决你的问题,请参考以下文章

决策树最骚操作

火炉炼AI机器学习006-用决策树回归器构建房价评估模型

机器学习算法基础+实战系列决策树算法

机器学习算法--贝叶斯分类器

机器学习笔记EM算法及实践(以混合高斯模型(GMM)为例来次完整的EM)

Spark机器学习:决策树算法