Keras:使用批量标准化在同一数据集上的不同训练和验证结果
Posted
技术标签:
【中文标题】Keras:使用批量标准化在同一数据集上的不同训练和验证结果【英文标题】:Keras: Different training and validation results on same dataset using batch normalization 【发布时间】:2017-11-18 06:29:56 【问题描述】:即使我使用相同的数据集,我的训练分类也很高,但验证分类却很低。此问题仅在使用批量标准化时发生。我是否正确实施它?
使用批量标准化的代码:
train_datagen = ImageDataGenerator(rescale=1. / 255)
train_generator = train_datagen.flow_from_directory(
directory = '../ImageFilter/Images/',
target_size=(img_rows, img_cols),
batch_size=batch_size,
class_mode='categorical',
shuffle=True)
model = Sequential()
model.add(Convolution2D(16,
kernel_size=(3, 3),
strides=(2,2),
activation='relu',
input_shape=(img_rows, img_cols, 3)))
model.add(BatchNormalization())
model.add(MaxPooling2D((2,2), strides=(2,2)))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dense(2, activation='softmax'))
model.compile(loss='categorical_crossentropy',
optimizer='adam',
metrics = ['accuracy'])
epochs = 100
patience = 6
n_images = 91
file_path = 'imageFilterCNN.hdf5'
checkpointer = ModelCheckpoint(file_path, monitor='val_acc', verbose=0, save_best_only=True)
earlystop = EarlyStopping(monitor='val_acc', patience=patience, verbose=0, mode='auto')
tboard = TensorBoard('./logs')
model.fit_generator(
train_generator,
steps_per_epoch=n_images// batch_size,
epochs=epochs,
callbacks=[checkpointer, earlystop, tboard],
validation_data=train_generator,
validation_steps=n_images// batch_size)
输出: 时代 15/100 11/11 [===============================] - 2s - 损失:0.0092 - acc: 1.0000 - val_loss:3.0321 - val_acc:0.5568
【问题讨论】:
这些结果有什么奇怪的地方?训练准确率永远比测试好;你有什么理由期望泛化很简单? 我正在对其进行训练的同一数据集上进行测试。所以结果应该是非常相似的。 【参考方案1】:您正在对第一层(输入)应用批量标准化,这很可能是一个错误。你为什么要这样做?您的输入是图像,并且您非常清楚如何规范化您的输入 - 事实上,这就是您在第一行所做的。再次应用标准化是没有意义的。
批量归一化应用于隐藏层,这样数据就不会变得太大或太小。没有简单、通用的方法可以做到这一点,因此Sergey Ioffe and Christian Szegedy 引入了这个特殊层。
【讨论】:
好的。我在第一层取出了批量标准化。我仍然遇到同样的问题。当我在同一个数据集上训练和验证/测试时,我的训练结果比我的测试结果要好得多。 @mcudic 你有没有解决你的问题?你能包括你正在使用的 Keras 和 Tensorflow 的版本吗?以及 CUDA 和 CuDNN 的版本?以上是关于Keras:使用批量标准化在同一数据集上的不同训练和验证结果的主要内容,如果未能解决你的问题,请参考以下文章
Keras:训练和验证集上的 model.evaluate() 与上次训练时期后的 acc 和 val_acc 不同