如何在 WEKA 中测试分类数据集?

Posted

技术标签:

【中文标题】如何在 WEKA 中测试分类数据集?【英文标题】:how to test classification data set in WEKA? 【发布时间】:2014-12-28 21:23:44 【问题描述】:

我有一个大数据集,其中包含最后一个属性类标签作为文本。

我正在使用 Weka 使用 J48 决策树进行训练分类。 60% 的数据集用于训练,40% 用于测试。如何在 Weka 中预测班级?

我把类 '?'而不是最后一个属性中的类,我想预测它。为什么混淆矩阵输出为零,实例总数为零?

我选择了“更多选项”,然后选择“输出预测”作为“纯文本”来显示结果。

【问题讨论】:

我不确定您要预测什么。如果您尝试预测最后一个属性,则应选择最后一个属性进行训练。能否请您更详细地描述问题? 【参考方案1】:

在 Weka 浏览器中,

转到“分类”面板, 单击左侧的选择框,位于“更多选项...”按钮和“开始”按钮之间。 单击选择框后,列表会展开。选择您要预测的列。

如果该列具有不适当的数据类型,您选择的算法无法处理,那么“开始...”按钮将处于非活动状态并显示为灰色。

然后转到“预处理”面板,并添加一个属性过滤器,例如“StringToNominal”。 (或对您的数据执行其他操作。)

【讨论】:

以上是关于如何在 WEKA 中测试分类数据集?的主要内容,如果未能解决你的问题,请参考以下文章

weka中如何对整个数据集进行分类

如何在 Weka Explorer 中应用分类器?

Weka 如何将类标签附加到测试数据集?

如何在 weka 中添加恶意特征进行分类作为数据集

Java:如何坚持 Weka 朴素贝叶斯分类器?

如何在weka中预处理数据以进行分类