ValueError:分类指标无法处理多标签指标和连续多输出目标的混合

Posted

技术标签:

【中文标题】ValueError:分类指标无法处理多标签指标和连续多输出目标的混合【英文标题】:ValueError: Classification metrics can't handle a mix of multilabel-indicator and continuous-multioutput targets 【发布时间】:2021-12-20 13:26:59 【问题描述】:

我不知道问题是什么以及为什么会出现此错误:

我可以尝试什么来解决这个问题?

代码如下:

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.datasets import make_classification
from sklearn.preprocessing import OneHotEncoder, MinMaxScaler
from sklearn.model_selection import train_test_split
tf.random.set_seed(0)

# generate the data
X, y = make_classification(n_classes=6, n_samples=1000, n_features=10, n_informative=10, n_redundant=0, random_state=42)
print(y.shape)
# (1000, )

# split the data
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)

# one-hot encode the target
enc = OneHotEncoder(sparse=False, handle_unknown='ignore')
enc.fit(y_train.reshape(-1, 1))
y_train = enc.transform(y_train.reshape(-1, 1))
y_test = enc.transform(y_test.reshape(-1, 1))
print(y_train.shape, y_test.shape)
# (750, 6) (250, 6)

# scale the features
scaler = MinMaxScaler()
scaler.fit(X_train)
X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)

# define the model
model = Sequential()
model.add(Dense(units=30, activation='relu'))
model.add(Dense(units=15, activation='relu'))
model.add(Dense(6, activation='softmax'))

# fit the model
model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])
model.fit(x=X_train, y=y_train, epochs=3, batch_size=10, validation_data=(X_test, y_test))

predictions = model.predict(X_test)

confusion_matrix(y_test,predictions)

print(classification_report(y_lab,predictions))

【问题讨论】:

【参考方案1】:

错误的原因是您将单热标签y_test 与由模型predictions 估计的类概率标签进行比较。一个快速的解决方法是将两者都转换为简单的分类标签,如下所示:

confusion_matrix(np.argmax(y_test, axis=1), np.argmax(predictions, axis=1))
classification_report(np.argmax(y_test, axis=1), np.argmax(predictions, axis=1))

【讨论】:

【参考方案2】:

这样就可以解决问题了:

y_test_arg=np.argmax(y_test,axis=1)
Y_pred = np.argmax(predictions,axis=1)
print(confusion_matrix(y_test_arg, Y_pred))

【讨论】:

您能否通过编辑您的答案来解释如何或为什么解决问题?

以上是关于ValueError:分类指标无法处理多标签指标和连续多输出目标的混合的主要内容,如果未能解决你的问题,请参考以下文章

f-score:ValueError:分类指标无法处理多标签指标和连续多输出目标的混合

如何处理 ValueError:分类指标无法处理多标签指标和多类目标错误的混合

Logistic 回归 - ValueError:分类指标无法处理连续多输出和二进制目标的混合

Python Sklearn“ValueError:分类指标无法处理多类多输出和二进制目标的混合”错误

错误:分类指标无法处理多类多输出和多标签指标目标的混合

混淆矩阵错误“分类指标无法处理多标签指标和多类目标的混合”