多标签分类器中的拟合概率

Posted

技术标签:

【中文标题】多标签分类器中的拟合概率【英文标题】:Fit Probabilities in Multi-Label Classifiers 【发布时间】:2012-11-08 23:26:47 【问题描述】:

我想使用 scikit-learn 将其分类为多个类别,如此处所述use scikit-learn to classify into multiple categories, 但我不想返回分类器计算的标签,而是返回成员概率。 scikit-learn 可以做到这一点吗?

【问题讨论】:

【参考方案1】:

确实,OneVsRestClassifier 还没有实现 predict_proba。请提交错误报告或向我们发送拉取请求(只需在 n_classes 基础估计器上调用 predict_proba 并将结果提供给 n_samples * n_classes 矩阵即可)。

【讨论】:

我将仔细查看 OneVsRestClassifier 源代码,看看我是否无法管理拉取请求。谢谢! 顺便说一句,您还需要进行归一化以使概率总和为 1。 实际上,在多标签的情况下,由于事件不是不相交的,所以概率不需要需要总和为 1 是不是真的?例如。如果sample_1 具有label_1 的事件以90% 的概率发生,这并不能告诉我们sample_1 具有label_2label_3label_4 标签的概率。 是的,你是对的。顺便说一句,您的问题可以通过为每个类训练一个单独的分类器来轻松解决。当然,在 OneVsRestClassifier 中支持开箱即用会更好;)

以上是关于多标签分类器中的拟合概率的主要内容,如果未能解决你的问题,请参考以下文章

用于多标签问题的 keras 模型的 scikit 学习链分类器的拟合方法错误

使用 Scikit Learn 和概率而不是简单标签的多标签分类

如何为多标签分类器/一对休息分类器腌制 sklearn 管道?

具有高度不平衡的多标签分类中的损失曲线

分类模型标签多少张合适呢

如何将图像(多维数组)数据拟合到 python 中的随机森林分类器中?