sklearn SGDClassifier,当没有匹配时产生标签?
Posted
技术标签:
【中文标题】sklearn SGDClassifier,当没有匹配时产生标签?【英文标题】:sklearn SGDClassifier, results a label when no match available? 【发布时间】:2017-06-16 13:03:05 【问题描述】:我正在使用 sklearn SGDClassifier 来预测我的数据集。 我有不应归类为任何标签/类别的文本,但我很惊讶,如果我将测试数据提供为“kjhd askdhajksdh asd askh”,它仍然被归类为给定类别之一。
我也处理过概率,但对于这个垃圾文本仍然有一个有价值的概率。
我的问题是,对于这种情况,分类器能否返回“未找到匹配项”等内容?
【问题讨论】:
【参考方案1】:没有。分类器将以最高概率将任何输入分类到训练中的标签之一,无论这些概率有多小。
您可以使用decision_function 设置标签的阈值。 类似的东西:
threshold = 0.25
if confidence_score < threshold:
print("No match found")
【讨论】:
以上是关于sklearn SGDClassifier,当没有匹配时产生标签?的主要内容,如果未能解决你的问题,请参考以下文章
sklearn 使用SGDClassifier 使用 kerasMNIST数据集 进行图片二分类
sklearn SGDClassifier 模型阈值与模型分数有何关系?
sklearn SGDClassifier fit() 与 partial_fit()