weka中如何对整个数据集进行分类
Posted
技术标签:
【中文标题】weka中如何对整个数据集进行分类【英文标题】:how to classify the whole data set in weka 【发布时间】:2015-10-04 06:30:46 【问题描述】:我有一个包含 6836 个实例的监督数据集,我需要知道我的模型对所有实例的预测,而不仅仅是测试集。
我按照方法 train-test (2/3-1/3) 了解我的 TPR 和 FPR 率,并且我得到了关于我的测试 (1/3) 的预测,但我需要知道对所有 6836 个实例的预测。
我该怎么做?
谢谢!
【问题讨论】:
【参考方案1】:在 Weka Explorer 的分类选项卡中,应该有一个按钮,上面写着“更多选项...”,如果您进入那里,您应该能够将预测输出为纯文本。如果您使用交叉验证而不是百分比拆分,您将获得对表中所有实例的预测,如下所示:
+-------+--------+-----------+-------+------------+
| inst# | actual | predicted | error | prediction |
+-------+--------+-----------+-------+------------+
| 1 | 2:no | 1:yes | + | 0.926 |
| 2 | 1:yes | 1:yes | | 0.825 |
| 1 | 2:no | 1:yes | + | 0.636 |
| 2 | 1:yes | 1:yes | | 0.808 |
| ... | ... | ... | ... | ... |
+-------+--------+-----------+-------+------------+
【讨论】:
【参考方案2】:如果您不想进行交叉验证,您也可以创建一个包含所有数据(训练 + 测试)的数据集并将其添加为测试数据。然后您可以转到更多选项并显示 Campino 已经回答的结果。
【讨论】:
以上是关于weka中如何对整个数据集进行分类的主要内容,如果未能解决你的问题,请参考以下文章