UndefinedMetricWarning:召回率和 F 分数定义不明确,在没有真实样本的标签中设置为 0.0。 'recall', 'true', 平均, warn_for)

Posted

技术标签:

【中文标题】UndefinedMetricWarning:召回率和 F 分数定义不明确,在没有真实样本的标签中设置为 0.0。 \'recall\', \'true\', 平均, warn_for)【英文标题】:UndefinedMetricWarning: Recall and F-score are ill-defined and being set to 0.0 in labels with no true samples. 'recall', 'true', average, warn_for)UndefinedMetricWarning:召回率和 F 分数定义不明确,在没有真实样本的标签中设置为 0.0。 'recall', 'true', 平均, warn_for) 【发布时间】:2018-08-05 10:13:24 【问题描述】:

当我使用以下代码为一类计算precision_recall_fscore_support 时(仅1s)

import numpy as np
from sklearn.metrics import precision_recall_fscore_support

#make arrays
ytrue = np.array(['1', '1', '1', '1', '1','1','1','1'])
ypred = np.array(['0', '0', '0', '1', '1','1','1','1'])

#keep only 1
y_true, y_pred = zip(*[[ytrue[i], ypred[i]] for i in range(len(ytrue)) if ytrue[i]=="1"])

#get scores
precision_recall_fscore_support(y_true, y_pred, average='weighted')

我收到以下警告:

UndefinedMetricWarning: Recall and F-score are ill-defined and being set to 0.0 in labels with no true samples.
  'recall', 'true', average, warn_for)

和输出:

(1.0, 0.625, 0.76923076923076927, None)

我在 SO UndefinedMetricWarning: F-score is ill-defined and being set to 0.0 in labels with no predicted samples 上发现了以下具有类似警告的内容,但我认为它不适用于我的问题。

问题:我的输出结果是否有效,或者我应该关注警告消息吗?如果是这样,我的代码有什么问题以及如何解决?

【问题讨论】:

阅读这些指标是如何定义的,就会清楚为什么不能用当前数据计算它们。这就像试图计算仅男性样本中女性吸烟者的比例。没有意义。 我尝试了下面的代码。但是,它被否决了,但我不知道为什么。 【参考方案1】:

你好我找到了解决这个问题的方法,你需要使用:

cv = ShuffleSplit(n_splits=10, test_size=0.3, random_state=0)

我正在使用 knn,这解决了问题

代码:

def knn(self,X_train,X_test,Y_train,Y_test):

   #implementación del algoritmo
   knn = KNeighborsClassifier(n_neighbors=3).fit(X_train,Y_train)
   #10XV
   cv = ShuffleSplit(n_splits=10, test_size=0.3, random_state=0)
   puntajes = sum(cross_val_score(knn, X_test, Y_test, 
                                        cv=cv,scoring='f1_weighted'))/10

   print(puntajes)

**链接:** https://scikit-learn.org/stable/modules/cross_validation.html

【讨论】:

以上是关于UndefinedMetricWarning:召回率和 F 分数定义不明确,在没有真实样本的标签中设置为 0.0。 'recall', 'true', 平均, warn_for)的主要内容,如果未能解决你的问题,请参考以下文章

sklearn报错解决方案UndefinedMetricWarning: Precision is ill-defined and being set to 0.0

sklearn报错解决方案UndefinedMetricWarning: Precision is ill-defined and being set to 0.0

搜广推 召回层主流策略 (多路召回Embedding召回)

推荐系统的召回

推荐系统[二]:召回算法超详细讲解[召回模型演化过程召回模型主流常见算法(DeepMF/TDM/Airbnb Embedding/Item2vec等)召回路径简介多路召回融合]

广告系列:召回与排序