数据挖掘常用算法之决策树算法
Posted 涛哥学数据分析
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据挖掘常用算法之决策树算法相关的知识,希望对你有一定的参考价值。
“ 以下是决策树算法在R语言中的运用过程,数据集采用R自带鸢尾花分类数据集。”
01
—
算法运用图示
02
—
部分效果图
一、rpart.plot画出决策树结构图
二、算法得出的比较矩阵形式
03
—
决策树算法相关知识
决策树算法在叶子结点的类型为离散和连续时,分别对应为分类与回归工具;不同版本的决策树算法或采用不同的分支标准(信息熵、信息增益、信息增益率、分离信息、基尼系数),或采用不同的剪枝方法(先剪枝、后剪枝、悲观剪枝等)
以下是决策树三个版本的简单对比:
以上是关于数据挖掘常用算法之决策树算法的主要内容,如果未能解决你的问题,请参考以下文章