sklearn SGDClassifier,当没有匹配时产生标签?

Posted

技术标签:

【中文标题】sklearn SGDClassifier,当没有匹配时产生标签?【英文标题】:sklearn SGDClassifier, results a label when no match available? 【发布时间】:2017-06-16 13:03:05 【问题描述】:

我正在使用 sklearn SGDClassifier 来预测我的数据集。 我有不应归类为任何标签/类别的文本,但我很惊讶,如果我将测试数据提供为“kjhd askdhajksdh asd askh”,它仍然被归类为给定类别之一。

我也处理过概率,但对于这个垃圾文本仍然有一个有价值的概率。

我的问题是,对于这种情况,分类器能否返回“未找到匹配项”等内容?

【问题讨论】:

【参考方案1】:

没有。分类器将以最高概率将任何输入分类到训练中的标签之一,无论这些概率有多小。

您可以使用decision_function 设置标签的阈值。 类似的东西:

threshold = 0.25
if confidence_score < threshold:
    print("No match found")

【讨论】:

以上是关于sklearn SGDClassifier,当没有匹配时产生标签?的主要内容,如果未能解决你的问题,请参考以下文章

sklearn 使用SGDClassifier 使用 kerasMNIST数据集 进行图片二分类

Sklearn SGDClassifier 部分拟合

sklearn SGDClassifier 模型阈值与模型分数有何关系?

sklearn SGDClassifier fit() 与 partial_fit()

Scikit-learn——LogisticRegression与SGDClassifier

grid-search建模过程中自动调优