Weka 分类器精度

Posted

技术标签:

【中文标题】Weka 分类器精度【英文标题】:Weka Classifier Accuracy 【发布时间】:2015-06-15 11:24:09 【问题描述】:

我有来自 17 个类的 73,841 个数据实例,我用它们来训练带有 WEKA 的分类器。数据经过FFT过滤,每个实例有3个点。

I.e. 85724.5409, 40953.2485, 3204935, 4539024.002345, ?/class

我尝试了三个分类器:SMO/J48/朴素贝叶斯。

SMO/朴素贝叶斯的准确率达到 16%

但 J48 分类器的准确率达到 98/99%。

问题:

    我可以安全地假设 J48 分类器犯了某种错误吗? 为什么两个结果如此相似,而另一个却完全不同?

    如何提高准确性?是不是有太多的类,这些类根本就不能分离?

谢谢

【问题讨论】:

请发一个 mcve:***.com/help/mcve 觉得我做得更好了吗? 【参考方案1】:

我强烈认为决策树的输出不准确。

您能否提供生成的树或前 10 个节点以查看确切的问题。

以下是我建议的一些提高准确性的措施。

班级规模:17班确实很大。尝试通过合并相似的类来减少。 (仅在不影响项目范围的情况下进行。) 非线性分类器:因为你有 17 个类,所以像朴素贝叶斯/决策树这样的线性分类器是不够的。您是否尝试过任何非线性 SVM 或像随机森林这样的集成学习。如果 17 个类别中的每一个都有足够的数据集,那么 HMM 将是更好分类的好选择。

谢谢, 阿拉维

【讨论】:

以上是关于Weka 分类器精度的主要内容,如果未能解决你的问题,请参考以下文章

Weka - 如何查找分类器的输入格式

Weka 分类器的参数

尝试将 AdaBostM1 weka 分类器与配置用于修剪的 J48 决策树分类器一起使用时,Weka 引发命令行错误

使用weka分类器后,提取分类模型的源代码

使用weka分类器后,提取分类模型的源代码

使用weka分类器后,提取分类模型的源代码