weka中如何对整个数据集进行分类

Posted

技术标签:

【中文标题】weka中如何对整个数据集进行分类【英文标题】:how to classify the whole data set in weka 【发布时间】:2015-10-04 06:30:46 【问题描述】:

我有一个包含 6836 个实例的监督数据集,我需要知道我的模型对所有实例的预测,而不仅仅是测试集。

我按照方法 train-test (2/3-1/3) 了解我的 TPR 和 FPR 率,并且我得到了关于我的测试 (1/3) 的预测,但我需要知道对所有 6836 个实例的预测。

我该怎么做?

谢谢!

【问题讨论】:

【参考方案1】:

在 Weka Explorer 的分类选项卡中,应该有一个按钮,上面写着“更多选项...”,如果您进入那里,您应该能够将预测输出为纯文本。如果您使用交叉验证而不是百分比拆分,您将获得对表中所有实例的预测,如下所示:

+-------+--------+-----------+-------+------------+
| inst# | actual | predicted | error | prediction |
+-------+--------+-----------+-------+------------+
| 1     | 2:no   | 1:yes     | +     | 0.926      |
| 2     | 1:yes  | 1:yes     |       | 0.825      |
| 1     | 2:no   | 1:yes     | +     | 0.636      |
| 2     | 1:yes  | 1:yes     |       | 0.808      |
| ...   | ...    | ...       | ...   | ...        |
+-------+--------+-----------+-------+------------+

【讨论】:

【参考方案2】:

如果您不想进行交叉验证,您也可以创建一个包含所有数据(训练 + 测试)的数据集并将其添加为测试数据。然后您可以转到更多选项并显示 Campino 已经回答的结果。

【讨论】:

以上是关于weka中如何对整个数据集进行分类的主要内容,如果未能解决你的问题,请参考以下文章

如何在weka中预处理数据以进行分类

如何在 weka 中添加恶意特征进行分类作为数据集

如何在 WEKA 中测试分类数据集?

如何在 Weka Explorer 中应用分类器?

关于使用独立数据集通过 weka 验证文本分类的问题

weka中用J48(即C4.5)算法对数据集进行训练建模与测试,结果不是很理想,