有没有一种简单的方法来获得多类分类的混淆矩阵? (OneVsRest)

Posted

技术标签:

【中文标题】有没有一种简单的方法来获得多类分类的混淆矩阵? (OneVsRest)【英文标题】:Is there an easy way to get confusion matrix for multiclass classification? (OneVsRest) 【发布时间】:2017-04-22 03:55:09 【问题描述】:

我在三类分类问题(三个随机森林)上使用 OneVsRest 分类器。每个类的出现被定义为我的虚拟整数(出现为 1,否则为 0)。我想知道是否有一种简单的替代方法来创建混淆矩阵?正如我遇到的所有方法一样,采用 y_pred、y_train = array、shape = [n_samples] 形式的参数。理想情况下,我想要 y_pred, y_train = array , shape = [n_samples, n_classes]

一些示例,类似于问题的结构:

y_train = np.array([(1,0,0), (1,0,0), (0,0,1), (1,0,0), (0,1,0)])
y_pred = np.array([(1,0,0), (0,1,0), (0,0,1), (0,1,0), (1,0,0)])


print(metrics.confusion_matrix(y_train, y_pred) 

返回: 不支持多标签指示符

【问题讨论】:

这看起来像多类而不是多标签。 【参考方案1】:

您可以尝试像下面这样一次性获取所有详细信息。

from sklearn.metrics import confusion_matrix
confusion_matrix(y_test.argmax(axis=1), y_pred.argmax(axis=1))

这将为您提供如下内容:

array([[ 7,  0,  0,  0],
       [ 0,  7,  0,  0],
       [ 0,  1,  2,  4],
       [ 0,  1,  0, 11]])  

-这意味着所有对角线都被正确预测。

【讨论】:

【参考方案2】:

我不知道您的想法是什么,因为您没有指定要查找的输出,但您可以通过以下两种方式进行操作:

1.每列一个混淆矩阵

In [1]:
for i in range(y_train.shape[1]):
    print("Col ".format(i))
    print(metrics.confusion_matrix(y_train[:,i], y_pred[:,i]))
    print("")

Out[1]:
Col 0
[[1 1]
 [2 1]]

Col 1
[[2 2]
 [1 0]]

Col 2
[[4 0]
 [0 1]]

2.一个混淆矩阵

为此,我们将展平数组:

In [2]: print(metrics.confusion_matrix(y_train.flatten(), y_pred.flatten()))

Out[2]:
[[7 3]
 [3 2]]

【讨论】:

以上是关于有没有一种简单的方法来获得多类分类的混淆矩阵? (OneVsRest)的主要内容,如果未能解决你的问题,请参考以下文章

从混淆矩阵计算真正值以进行多类分类

CNN keras 中图像的混淆矩阵

如何在 Scikit 中计算多类分类的混淆矩阵?

使用 R 在 keras 中为多类分类创建混淆矩阵

如何从多类分类的混淆矩阵中提取假阳性、假阴性

混淆矩阵错误“分类指标无法处理多标签指标和多类目标的混合”