使用 sklearn 使用 Keras 数据生成器绘制混淆矩阵
Posted
技术标签:
【中文标题】使用 sklearn 使用 Keras 数据生成器绘制混淆矩阵【英文标题】:Plot confusion matrix with Keras data generator using sklearn 【发布时间】:2021-07-21 23:21:53 【问题描述】:Sklearn 明确定义了如何使用自己的分类模型1 绘制混淆矩阵。 但是如何将它与使用数据生成器的 Keras 模型一起使用呢?让我们看一个示例代码: 首先我们需要训练模型。
import numpy as np
from keras import backend as K
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Activation, Flatten
from keras.layers.convolutional import Convolution2D, MaxPooling2D
from keras.preprocessing.image import ImageDataGenerator
from sklearn.metrics import classification_report, confusion_matrix
#Start
train_data_path = 'F://data//Train'
test_data_path = 'F://data//Validation'
img_rows = 150
img_cols = 150
epochs = 30
batch_size = 32
num_of_train_samples = 3000
num_of_test_samples = 600
#Image Generator
train_datagen = ImageDataGenerator(rescale=1. / 255,
rotation_range=40,
width_shift_range=0.2,
height_shift_range=0.2,
shear_range=0.2,
zoom_range=0.2,
horizontal_flip=True,
fill_mode='nearest')
test_datagen = ImageDataGenerator(rescale=1. / 255)
train_generator = train_datagen.flow_from_directory(train_data_path,
target_size=(img_rows, img_cols),
batch_size=batch_size,
class_mode='categorical')
validation_generator = test_datagen.flow_from_directory(test_data_path,
target_size=(img_rows, img_cols),
batch_size=batch_size,
class_mode='categorical')
# Build model
model = Sequential()
model.add(Convolution2D(32, (3, 3), input_shape=(img_rows, img_cols, 3), padding='valid'))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Convolution2D(32, (3, 3), padding='valid'))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Convolution2D(64, (3, 3), padding='valid'))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Flatten())
model.add(Dense(64))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(5))
model.add(Activation('softmax'))
model.compile(loss='categorical_crossentropy',
optimizer='rmsprop',
metrics=['accuracy'])
#Train
model.fit_generator(train_generator,
steps_per_epoch=num_of_train_samples // batch_size,
epochs=epochs,
validation_data=validation_generator,
validation_steps=num_of_test_samples // batch_size)
现在,在模型训练好之后,让我们构建一个混淆矩阵。
#Confution Matrix and Classification Report
Y_pred = model.predict_generator(validation_generator, num_of_test_samples // batch_size+1)
y_pred = np.argmax(Y_pred, axis=1)
print('Confusion Matrix')
print(confusion_matrix(validation_generator.classes, y_pred))
print('Classification Report')
target_names = ['Cats', 'Dogs', 'Horse']
print(classification_report(validation_generator.classes, y_pred, target_names=target_names))
到目前为止,这工作正常。但是如何以与上述 sklearn 示例相同的布局将其保存为 png?
高度赞赏任何想法。 提前致谢
【问题讨论】:
【参考方案1】:像这样(另见ConfusionMatrixDisplay
和confusion_matrix
):
from sklearn.metrics import ConfusionMatrixDisplay
from sklearn.metrics import confusion_matrix
import matplotlib.pyplot as plt
import numpy as np
y_pred = np.array([0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2])
y_test = np.array([0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 2, 2, 2, 1, 2])
labels = ["Cats", "Dogs", "Horses"]
cm = confusion_matrix(y_test, y_pred)
disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=labels)
disp.plot(cmap=plt.cm.Blues)
plt.show()
结果:
【讨论】:
你现在真的如何将 x-axix 标签对角线? 您可能需要在轴上调整tick_params
。几天前他们转发了“Ticks in Matplotlib”,有一个关于“提示和技巧”的简短指南:e2eml.school/matplotlib_ticks.html
我遇到的另一个问题是 y 轴上的左侧标签“Groundtruth 标签”被截断了一半。 x轴上的旋转标签太长,意味着也被切断了。你有什么想法,如何让他自动将整个图形调整到正确的大小?再次感谢
我以前没有经历过这样的事情。你有很长的标签吗?那可能必须是一个单独的问题,我只能在这里推测。
是的,请看***.com/questions/67636940/…以上是关于使用 sklearn 使用 Keras 数据生成器绘制混淆矩阵的主要内容,如果未能解决你的问题,请参考以下文章
Keras:使用 model.fit() 洗牌数据不会做出改变,但 sklearn.train_test_split() 会