数据挖掘常用算法之决策树算法

Posted 涛哥学数据分析

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据挖掘常用算法之决策树算法相关的知识,希望对你有一定的参考价值。

以下是决策树算法在R语言中的运用过程,数据集采用R自带鸢尾花分类数据集。”



01

算法运用图示


02


部分效果图


一、rpart.plot画出决策树结构图

数据挖掘常用算法之决策树算法


二、算法得出的比较矩阵形式

数据挖掘常用算法之决策树算法



03


决策树算法相关知识


        决策树算法在叶子结点的类型为离散和连续时,分别对应为分类与回归工具;不同版本的决策树算法或采用不同的分支标准(信息熵、信息增益、信息增益率、分离信息、基尼系数),或采用不同的剪枝方法(先剪枝、后剪枝、悲观剪枝等)

以下是决策树三个版本的简单对比:




参考链接:http://blog.csdn.net/sinat_26917383/article/details/47617801




以上是关于数据挖掘常用算法之决策树算法的主要内容,如果未能解决你的问题,请参考以下文章

SparkMLlib回归算法之决策树

「数据挖掘入门系列」数据挖掘模型之分类与预测 - 决策树

机器学习算法之决策树

决策树算法之随机森林

web安全之机器学习入门——3.2 决策树与随机森林算法

Python机器学习算法之决策树算法