Weka - 如何查找分类器的输入格式

Posted

技术标签:

【中文标题】Weka - 如何查找分类器的输入格式【英文标题】:Weka - How to find input format for classifiers 【发布时间】:2013-09-14 14:53:19 【问题描述】:

我在 Java 程序中使用 Weka 对一些文本文档进行分类,并使其与 NaiveBayesMultinomial 分类器配合使用。

但是,我似乎找不到任何关于如何过滤我的实例(或 ARFF 文件)的文档,以便它们可以被其他分类器接受为输入。如果我将 ARFF 加载到 Weka Explorer GUI 中,那么大多数分类器都是灰色的。使用 StringToWordVector 过滤器不会影响这一点,我也尝试了其他一些。

谁能告诉我如何准备我的数据以便其他分类器(例如 NaiveBayes、JRip 或 BayesNet)接受它?

【问题讨论】:

【参考方案1】:

在 WEKA Explorer GUI 中,当您应用 StringToWordVector 时,以前的类属性最常移动到第一个属性,因此默认情况下不会将其检测为类。当您在分类选项卡时,请确保选择正确的属性作为您的实验的类。

另一个潜在的问题来源是该类是数字类,因此无法应用某些算法(需要一个名义类)。

如果这不能解决您的问题,请发布您的 ARFF 文件的摘录(标题摘录加一个实例),以便我们提供更准确的建议。

【讨论】:

以上是关于Weka - 如何查找分类器的输入格式的主要内容,如果未能解决你的问题,请参考以下文章

如何提高 Weka 中 SMO 分类器的性能?

如何将训练数据转换为 weka 分类器的测试数据?

在 Weka 中级联分类器的错误方法

在 Weka 中实现元分类器的参数

运行 weka 分类器的 C# 代码

Weka 中 SMO、NaiveBayes 和 BayesNet 分类器的不同结果