如何在 Weka GUI 中识别错误分类实例的详细信息?

Posted

技术标签:

【中文标题】如何在 Weka GUI 中识别错误分类实例的详细信息?【英文标题】:How to identify the details of incorrectly classified instances in Weka GUI? 【发布时间】:2018-09-19 15:27:14 【问题描述】:

我想使用 Weka GUI 获取错误分类实例的详细信息(唯一 ID)。我正在关注this question 的答案。在那里,他们要求在预处理选项卡中使用过滤器StringToNominal 来转换 unique id,它是一个字符串。但是,通过遵循这一点,我怀疑分类器是否将 unique id 列也视为分类过程中的一个特征?

请建议我处理此问题的正确方法。

如果需要,我很乐意提供示例。

【问题讨论】:

我怀疑分类器在分类过程中是否将唯一 id 列也考虑为一个特征? 我不明白为什么,你试过了吗?分类器输出应该显示模型中有哪些属性。 @nekomatic 哦,我没查。谢谢你的好建议。你能告诉我是否有更好的方法来做到这一点?还是您也推荐这种方法? 【参考方案1】:

假设您想要 (1) 添加一个实例 ID,(2) 在模型中不使用该实例 ID,以及 (3) 查看各个预测,包括实例 ID 和其他一些属性。

我们将使用较小的数据集来展示这一点。例如,打开 iris.arff。

在“预处理”选项卡的“无监督属性”过滤器中使用 AddID 过滤器。 ID 将是第一个属性。

现在我们需要在建模过程中忽略它。将过滤后的分类器与删除过滤器一起使用。

我们需要输出带有 ID 变量的预测,这样我们才能看到发生了什么。这里我们输出所有的属性,虽然我们不需要做所有的事情。

我们在输出窗口中得到这个细节:

=== Predictions on test split ===

inst#,actual,predicted,error,prediction,ID,sepallength,sepalwidth,petallength,petalwidth
1,2:Iris-versicolor,2:Iris-versicolor,,0.968,53,6.9,3.1,4.9,1.5
2,3:Iris-virginica,3:Iris-virginica,,0.968,131,7.4,2.8,6.1,1.9
3,2:Iris-versicolor,2:Iris-versicolor,,0.968,59,6.6,2.9,4.6,1.3
4,1:Iris-setosa,1:Iris-setosa,,1,36,5,3.2,1.2,0.2
5,3:Iris-virginica,3:Iris-virginica,,0.968,101,6.3,3.3,6,2.5
6,2:Iris-versicolor,2:Iris-versicolor,,0.968,88,6.3,2.3,4.4,1.3
7,1:Iris-setosa,1:Iris-setosa,,1,42,4.5,2.3,1.3,0.3
8,1:Iris-setosa,1:Iris-setosa,,1,8,5,3.4,1.5,0.2

等等。

【讨论】:

以上是关于如何在 Weka GUI 中识别错误分类实例的详细信息?的主要内容,如果未能解决你的问题,请参考以下文章

weka - 如何打印错误分类的实例

Weka中决策树和混淆矩阵中正确/错误分类实例之间的差异

Weka 中的不同分类结果:GUI vs Java 库

哪个更快,使用 weka gui 或实现 weka java 代码?

如何在 Weka 分类器中使用 svm?

Weka分类:错误+正确<总实例数,怎么来的?