机器学习-数值预测的树
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习-数值预测的树相关的知识,希望对你有一定的参考价值。
树的长处有一个就是在不需预处理的前提下处理很多的类型。就是不需要常规化,标准化数据的特征。
区分regression tree跟model tree.
1.Regression Tree
数值树的建立的基本原理跟类型树的建立过程是相同的。在拆分方式上,数值型的有其方法。数值型的拆分标准是standard deviation reduction(SDR)。定义如下:
|Ti|
SDR = sd(T) - Σ —— * sd(Ti)
|T|
|T| - T集合里数目
衡量预测性能的方法:
a.可以计算输出向量跟测试向量的相关性 cor。 相关度越高越好。这种方法是衡量相关强度(how strong).
b. 另外一种是衡量相差多远(how far). 这种方法计算预测值与测试值之间平均相差多上。 这个度量叫做mean aboslute error(MAE).
1 n
MAE = —— Σ |ei|
n i=1
ei 就是预测值与真实值的差。
2。Model Tree
Model Tree是在Regression Tree 的基础上把叶子节点(leaf node) 用线回归模型来替换。这样通常可以带来更准确的预测结果。
较为先进的算法是M5‘ 算法(M5-prime)
以上是关于机器学习-数值预测的树的主要内容,如果未能解决你的问题,请参考以下文章