Keras:使用批量标准化在同一数据集上的不同训练和验证结果

Posted

技术标签:

【中文标题】Keras:使用批量标准化在同一数据集上的不同训练和验证结果【英文标题】:Keras: Different training and validation results on same dataset using batch normalization 【发布时间】:2017-11-18 06:29:56 【问题描述】:

即使我使用相同的数据集,我的训练分类也很高,但验证分类却很低。此问题仅在使用批量标准化时发生。我是否正确实施它?

使用批量标准化的代码:

train_datagen = ImageDataGenerator(rescale=1. / 255)
train_generator = train_datagen.flow_from_directory(
directory = '../ImageFilter/Images/',
target_size=(img_rows, img_cols),
batch_size=batch_size,
class_mode='categorical',
shuffle=True)

model = Sequential()

model.add(Convolution2D(16,
kernel_size=(3, 3),
strides=(2,2),
activation='relu',
input_shape=(img_rows, img_cols, 3)))
model.add(BatchNormalization())
model.add(MaxPooling2D((2,2), strides=(2,2)))

model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dense(2, activation='softmax'))

model.compile(loss='categorical_crossentropy',
optimizer='adam',
metrics = ['accuracy'])
epochs = 100
patience = 6
n_images = 91
file_path = 'imageFilterCNN.hdf5'

checkpointer = ModelCheckpoint(file_path, monitor='val_acc', verbose=0, save_best_only=True)
earlystop = EarlyStopping(monitor='val_acc', patience=patience, verbose=0, mode='auto')
tboard = TensorBoard('./logs')

model.fit_generator(
train_generator,
steps_per_epoch=n_images// batch_size,
epochs=epochs,
callbacks=[checkpointer, earlystop, tboard],
validation_data=train_generator,
validation_steps=n_images// batch_size)

输出: 时代 15/100 11/11 [===============================] - 2s - 损失:0.0092 - acc: 1.0000 - val_loss:3.0321 - val_acc:0.5568

【问题讨论】:

这些结果有什么奇怪的地方?训练准确率永远比测试好;你有什么理由期望泛化很简单? 我正在对其进行训练的同一数据集上进行测试。所以结果应该是非常相似的。 【参考方案1】:

您正在对第一层(输入)应用批量标准化,这很可能是一个错误。你为什么要这样做?您的输入是图像,并且您非常清楚如何规范化您的输入 - 事实上,这就是您在第一行所做的。再次应用标准化是没有意义的。

批量归一化应用于隐藏层,这样数据就不会变得太大或太小。没有简单、通用的方法可以做到这一点,因此Sergey Ioffe and Christian Szegedy 引入了这个特殊层。

【讨论】:

好的。我在第一层取出了批量标准化。我仍然遇到同样的问题。当我在同一个数据集上训练和验证/测试时,我的训练结果比我的测试结果要好得多。 @mcudic 你有没有解决你的问题?你能包括你正在使用的 Keras 和 Tensorflow 的版本吗?以及 CUDA 和 CuDNN 的版本?

以上是关于Keras:使用批量标准化在同一数据集上的不同训练和验证结果的主要内容,如果未能解决你的问题,请参考以下文章

在 keras 中使用批量标准化进行微调

Keras:训练和验证集上的 model.evaluate() 与上次训练时期后的 acc 和 val_acc 不同

Keras,训练期间验证集上的 auc 与 sklearn auc 不匹配

Keras 没有使用完整的 CPU 内核进行训练

保存的随机森林模型在同一数据集上产生不同的结果

Keras:在新实验中重用训练过的权重