weka中如何对整个数据集进行分类

Posted 2023-03-12

技术标签:

【中文标题】weka中如何对整个数据集进行分类【英文标题】：how to classify the whole data set in weka 【发布时间】：2015-10-04 06:30:46 【问题描述】：

我有一个包含 6836 个实例的监督数据集，我需要知道我的模型对所有实例的预测，而不仅仅是测试集。

我按照方法 train-test (2/3-1/3) 了解我的 TPR 和 FPR 率，并且我得到了关于我的测试 (1/3) 的预测，但我需要知道对所有 6836 个实例的预测。

我该怎么做？

谢谢！

【问题讨论】：

【参考方案1】：

在 Weka Explorer 的分类选项卡中，应该有一个按钮，上面写着“更多选项...”，如果您进入那里，您应该能够将预测输出为纯文本。如果您使用交叉验证而不是百分比拆分，您将获得对表中所有实例的预测，如下所示：

+-------+--------+-----------+-------+------------+
| inst# | actual | predicted | error | prediction |
+-------+--------+-----------+-------+------------+
| 1     | 2:no   | 1:yes     | +     | 0.926      |
| 2     | 1:yes  | 1:yes     |       | 0.825      |
| 1     | 2:no   | 1:yes     | +     | 0.636      |
| 2     | 1:yes  | 1:yes     |       | 0.808      |
| ...   | ...    | ...       | ...   | ...        |
+-------+--------+-----------+-------+------------+

【讨论】：

【参考方案2】：

如果您不想进行交叉验证，您也可以创建一个包含所有数据（训练 + 测试）的数据集并将其添加为测试数据。然后您可以转到更多选项并显示 Campino 已经回答的结果。

【讨论】：

以上是关于weka中如何对整个数据集进行分类的主要内容，如果未能解决你的问题，请参考以下文章

如何在weka中预处理数据以进行分类

如何在 weka 中添加恶意特征进行分类作为数据集

如何在 WEKA 中测试分类数据集？

如何在 Weka Explorer 中应用分类器？

关于使用独立数据集通过 weka 验证文本分类的问题

weka中用J48(即C4.5)算法对数据集进行训练建模与测试,结果不是很理想,