多标签分类器中的拟合概率
Posted
技术标签:
【中文标题】多标签分类器中的拟合概率【英文标题】:Fit Probabilities in Multi-Label Classifiers 【发布时间】:2012-11-08 23:26:47 【问题描述】:我想使用 scikit-learn 将其分类为多个类别,如此处所述use scikit-learn to classify into multiple categories, 但我不想返回分类器计算的标签,而是返回成员概率。 scikit-learn 可以做到这一点吗?
【问题讨论】:
【参考方案1】:确实,OneVsRestClassifier 还没有实现 predict_proba。请提交错误报告或向我们发送拉取请求(只需在 n_classes 基础估计器上调用 predict_proba 并将结果提供给 n_samples * n_classes 矩阵即可)。
【讨论】:
我将仔细查看 OneVsRestClassifier 源代码,看看我是否无法管理拉取请求。谢谢! 顺便说一句,您还需要进行归一化以使概率总和为 1。 实际上,在多标签的情况下,由于事件不是不相交的,所以概率不需要需要总和为 1 是不是真的?例如。如果sample_1
具有label_1
的事件以90% 的概率发生,这并不能告诉我们sample_1 具有label_2
、label_3
或label_4
标签的概率。
是的,你是对的。顺便说一句,您的问题可以通过为每个类训练一个单独的分类器来轻松解决。当然,在 OneVsRestClassifier 中支持开箱即用会更好;)以上是关于多标签分类器中的拟合概率的主要内容,如果未能解决你的问题,请参考以下文章
用于多标签问题的 keras 模型的 scikit 学习链分类器的拟合方法错误
使用 Scikit Learn 和概率而不是简单标签的多标签分类