如何在 Weka GUI 中识别错误分类实例的详细信息？

Posted 2023-03-13

技术标签:

【中文标题】如何在 Weka GUI 中识别错误分类实例的详细信息？【英文标题】：How to identify the details of incorrectly classified instances in Weka GUI? 【发布时间】：2018-09-19 15:27:14 【问题描述】：

我想使用 Weka GUI 获取错误分类实例的详细信息（唯一 ID）。我正在关注this question 的答案。在那里，他们要求在预处理选项卡中使用过滤器StringToNominal 来转换 unique id，它是一个字符串。但是，通过遵循这一点，我怀疑分类器是否将 unique id 列也视为分类过程中的一个特征？

请建议我处理此问题的正确方法。

如果需要，我很乐意提供示例。

【问题讨论】：

我怀疑分类器在分类过程中是否将唯一 id 列也考虑为一个特征？ 我不明白为什么，你试过了吗？分类器输出应该显示模型中有哪些属性。 @nekomatic 哦，我没查。谢谢你的好建议。你能告诉我是否有更好的方法来做到这一点？还是您也推荐这种方法？ 【参考方案1】：

假设您想要 (1) 添加一个实例 ID，(2) 在模型中不使用该实例 ID，以及 (3) 查看各个预测，包括实例 ID 和其他一些属性。

我们将使用较小的数据集来展示这一点。例如，打开 iris.arff。

在“预处理”选项卡的“无监督属性”过滤器中使用 AddID 过滤器。 ID 将是第一个属性。

现在我们需要在建模过程中忽略它。将过滤后的分类器与删除过滤器一起使用。

我们需要输出带有 ID 变量的预测，这样我们才能看到发生了什么。这里我们输出所有的属性，虽然我们不需要做所有的事情。

我们在输出窗口中得到这个细节：

=== Predictions on test split ===

inst#,actual,predicted,error,prediction,ID,sepallength,sepalwidth,petallength,petalwidth
1,2:Iris-versicolor,2:Iris-versicolor,,0.968,53,6.9,3.1,4.9,1.5
2,3:Iris-virginica,3:Iris-virginica,,0.968,131,7.4,2.8,6.1,1.9
3,2:Iris-versicolor,2:Iris-versicolor,,0.968,59,6.6,2.9,4.6,1.3
4,1:Iris-setosa,1:Iris-setosa,,1,36,5,3.2,1.2,0.2
5,3:Iris-virginica,3:Iris-virginica,,0.968,101,6.3,3.3,6,2.5
6,2:Iris-versicolor,2:Iris-versicolor,,0.968,88,6.3,2.3,4.4,1.3
7,1:Iris-setosa,1:Iris-setosa,,1,42,4.5,2.3,1.3,0.3
8,1:Iris-setosa,1:Iris-setosa,,1,8,5,3.4,1.5,0.2

等等。

【讨论】：

以上是关于如何在 Weka GUI 中识别错误分类实例的详细信息？的主要内容，如果未能解决你的问题，请参考以下文章

weka - 如何打印错误分类的实例

Weka中决策树和混淆矩阵中正确/错误分类实例之间的差异

Weka 中的不同分类结果：GUI vs Java 库

哪个更快，使用 weka gui 或实现 weka java 代码？

如何在 Weka 分类器中使用 svm？

Weka分类：错误+正确<总实例数，怎么来的？