ValueError:未知标签类型:“未知”-标签是数字

Posted

技术标签:

【中文标题】ValueError:未知标签类型:“未知”-标签是数字【英文标题】:ValueError: Unknown label type: 'unknown'-Labels are numeric 【发布时间】:2018-03-16 14:26:12 【问题描述】:

我正在为二进制分类问题构建一个随机森林分类器。我的标签都是数字的。

print labels.unique()
[1 0]

print type(labels)
    <class 'pandas.core.series.Series'>
print labels.shape
(3000,)

但是当我用 Gridsearchcv 拟合模型时

pipeline = Pipeline(steps=[('scaler', scaler), ('algorithm', algo)])
cv = StratifiedShuffleSplit(labels, 5, test_size=0.25, random_state=42)
gs = GridSearchCV(pipeline, param_grid, cv=cv, scoring='f1')
gs.fit(features, labels)

我收到了这个错误

ValueError: Unknown label type: 'unknown'

但是当我使用

gs.fit(features, labels.astype(int))

一切正常。谁能告诉我标签的问题出在哪里?

【问题讨论】:

【参考方案1】:

您只需使用tolist() 方法更改要列出的标签类型。使用

labels_lst = labels.tolist()

Scikit-learn 无法自动将系列转换为标签列表。

【讨论】:

以上是关于ValueError:未知标签类型:“未知”-标签是数字的主要内容,如果未能解决你的问题,请参考以下文章

ValueError:未知标签类型

MLP 分类器:“ValueError:未知标签类型”

ValueError:未知标签类型:DecisionTreeClassifier() 中的“连续”

sklearn - KNeighborsClassifier - ValueError:未知标签类型:'连续'

ValueError:未知标签类型:SVM 中的“连续”错误

Python ValueError:未知标签类型:“连续”