随机森林分类 weka
Posted
技术标签:
【中文标题】随机森林分类 weka【英文标题】:Randomforest classification weka 【发布时间】:2013-09-22 04:07:43 【问题描述】:属性已保存在 csv 文件的 11 列中。如果列的顺序发生变化,那么 Randomforest 和 RandomTree 每次都会给出不同的准确度吗?
【问题讨论】:
【参考方案1】:特征的排序不会影响我知道的任何分类器(除了那些专门设计的分类器 - 比如时间序列和其他时间特征的专业分类器),无论它是神经网络、SVM、RandomForest、 RandomTree 或 NaiveBayes - 它只是一个数字简化,因为数组比集合更快,而“在引擎盖下”它们被视为无序集合(仅显示它来自哪个维度的索引)。
由于其概率/随机学习方法,每次运行代码时特定分类器的输出可能会发生变化。例如 - 神经网络具有随机初始化,RandomForests 具有随机子采样等。
所以答案令人惊讶的是“是的,它可以在列顺序改变后改变”,但原因不是顺序改变,而是事实上,在你这样做之后,内部随机数生成器已经通过了一些循环并且会产生不同的数字。
【讨论】:
以上是关于随机森林分类 weka的主要内容,如果未能解决你的问题,请参考以下文章
随机森林图像分类实战:随机森林分类聚类(Kmeans)降维后的数据随机森林分类聚类(Kmeans)降维后的合成(append)数据