多标签分类器中的拟合概率

Posted 2023-03-13

技术标签:

【中文标题】多标签分类器中的拟合概率【英文标题】：Fit Probabilities in Multi-Label Classifiers 【发布时间】：2012-11-08 23:26:47 【问题描述】：

我想使用 scikit-learn 将其分类为多个类别，如此处所述use scikit-learn to classify into multiple categories，但我不想返回分类器计算的标签，而是返回成员概率。 scikit-learn 可以做到这一点吗？

【问题讨论】：

【参考方案1】：

确实，OneVsRestClassifier 还没有实现 predict_proba。请提交错误报告或向我们发送拉取请求（只需在 n_classes 基础估计器上调用 predict_proba 并将结果提供给 n_samples * n_classes 矩阵即可）。

【讨论】：

我将仔细查看 OneVsRestClassifier 源代码，看看我是否无法管理拉取请求。谢谢！顺便说一句，您还需要进行归一化以使概率总和为 1。实际上，在多标签的情况下，由于事件不是不相交的，所以概率不需要需要总和为 1 是不是真的？例如。如果sample_1 具有label_1 的事件以90% 的概率发生，这并不能告诉我们sample_1 具有label_2、label_3 或label_4 标签的概率。是的，你是对的。顺便说一句，您的问题可以通过为每个类训练一个单独的分类器来轻松解决。当然，在 OneVsRestClassifier 中支持开箱即用会更好；）

以上是关于多标签分类器中的拟合概率的主要内容，如果未能解决你的问题，请参考以下文章

用于多标签问题的 keras 模型的 scikit 学习链分类器的拟合方法错误

使用 Scikit Learn 和概率而不是简单标签的多标签分类

如何为多标签分类器/一对休息分类器腌制 sklearn 管道？

具有高度不平衡的多标签分类中的损失曲线

分类模型标签多少张合适呢

如何将图像（多维数组）数据拟合到 python 中的随机森林分类器中？