混淆矩阵 - 样本数量不一致的变量[重复]

Posted

技术标签:

【中文标题】混淆矩阵 - 样本数量不一致的变量[重复]【英文标题】:Confusion matrix - variables with inconsistent number of samples [duplicate] 【发布时间】:2020-12-07 13:49:24 【问题描述】:

在我调用 metrics.confusion_matrix(y_test, y_pred) 时,应用 KNN 分类器的数字数据进行监督学习时出现错误。执行错误消息是:发现样本数量不一致的输入变量:[40000, 2000]。提前感谢您展示灯光。

【问题讨论】:

你应该检查this post 【参考方案1】:

混淆矩阵比较两个数组中的值,基本上告诉有多少样本被标记为相同,有多少不同。为此,两个数组中的元素数量应该相同。这就是错误所说的内容。

所以要确保它们都具有相同数量的元素。

也许如果您包含以前处理 y_test 和 y_pred 的代码,就更容易看出为什么大小不同。

【讨论】:

以上是关于混淆矩阵 - 样本数量不一致的变量[重复]的主要内容,如果未能解决你的问题,请参考以下文章

混淆矩阵 - ValueError:发现样本数量不一致的输入变量

怎么计算混淆矩阵的消费者精度

样本类别不均会导致混淆矩阵的变化吗

ValueError:发现样本数量不一致的输入变量:[4, 304]

遥感软件中混淆矩阵是如何产生的

随机森林中的 class_weight 超参数改变了混淆矩阵中的样本数量