Weka 分类器精度

Posted 2023-03-12

技术标签:

【中文标题】Weka 分类器精度【英文标题】：Weka Classifier Accuracy 【发布时间】：2015-06-15 11:24:09 【问题描述】：

我有来自 17 个类的 73,841 个数据实例，我用它们来训练带有 WEKA 的分类器。数据经过FFT过滤，每个实例有3个点。

I.e. 85724.5409, 40953.2485, 3204935, 4539024.002345, ?/class

我尝试了三个分类器：SMO/J48/朴素贝叶斯。

SMO/朴素贝叶斯的准确率达到 16%

但 J48 分类器的准确率达到 98/99%。

问题：

我可以安全地假设 J48 分类器犯了某种错误吗？为什么两个结果如此相似，而另一个却完全不同？

如何提高准确性？是不是有太多的类，这些类根本就不能分离？

谢谢

【问题讨论】：

请发一个 mcve：***.com/help/mcve 觉得我做得更好了吗？ 【参考方案1】：

我强烈认为决策树的输出不准确。

您能否提供生成的树或前 10 个节点以查看确切的问题。

以下是我建议的一些提高准确性的措施。

班级规模：17班确实很大。尝试通过合并相似的类来减少。（仅在不影响项目范围的情况下进行。） 非线性分类器：因为你有 17 个类，所以像朴素贝叶斯/决策树这样的线性分类器是不够的。您是否尝试过任何非线性 SVM 或像随机森林这样的集成学习。如果 17 个类别中的每一个都有足够的数据集，那么 HMM 将是更好分类的好选择。

谢谢，阿拉维

【讨论】：

以上是关于Weka 分类器精度的主要内容，如果未能解决你的问题，请参考以下文章

Weka - 如何查找分类器的输入格式

Weka 分类器的参数

尝试将 AdaBostM1 weka 分类器与配置用于修剪的 J48 决策树分类器一起使用时，Weka 引发命令行错误

使用weka分类器后，提取分类模型的源代码