随机森林分类 weka

Posted

技术标签:

【中文标题】随机森林分类 weka【英文标题】:Randomforest classification weka 【发布时间】:2013-09-22 04:07:43 【问题描述】:

属性已保存在 csv 文件的 11 列中。如果列的顺序发生变化,那么 Randomforest 和 RandomTree 每次都会给出不同的准确度吗?

【问题讨论】:

【参考方案1】:

特征的排序不会影响我知道的任何分类器(除了那些专门设计的分类器 - 比如时间序列和其他时间特征的专业分类器),无论它是神经网络、SVM、RandomForest、 RandomTree 或 NaiveBayes - 它只是一个数字简化,因为数组比集合更快,而“在引擎盖下”它们被视为无序集合(仅显示它来自哪个维度的索引)。

由于其概率/随机学习方法,每次运行代码时特定分类器的输出可能会发生变化。例如 - 神经网络具有随机初始化,RandomForests 具有随机子采样等。

所以答案令人惊讶的是“是的,它可以在列顺序改变后改变”,但原因不是顺序改变,而是事实上,在你这样做之后,内部随机数生成器已经通过了一些循环并且会产生不同的数字。

【讨论】:

以上是关于随机森林分类 weka的主要内容,如果未能解决你的问题,请参考以下文章

如何在 Weka GUI 中获取随机森林生成的树模型?

随机森林表现低于预期

分类算法 - 随机森林

有没有办法在 Android 上使用随机森林模型进行预测?

随机森林图像分类实战:随机森林分类聚类(Kmeans)降维后的数据随机森林分类聚类(Kmeans)降维后的合成(append)数据

随机森林