Keras CNN 精度要么是静态的,要么对于图像分类来说太高了
Posted
技术标签:
【中文标题】Keras CNN 精度要么是静态的,要么对于图像分类来说太高了【英文标题】:Keras CNN accuracy is either static or way too high for image classification 【发布时间】:2021-01-31 16:12:44 【问题描述】:我正在尝试实现一个卷积神经网络,它可以检测一个人是否戴眼镜。不幸的是,无论我使用哪种确切的设置来设置学习率、特定的优化器等,我都会得到非常奇怪的结果。对于大多数设置,我注意到我的模型的准确性在第二个 epoch 之后并没有改变并且卡在0.56(接近一个标签2700张图片与另一个标签2200张图片的比率)。在其他运行中,设置稍有不同,准确率突然飙升至 0.9 左右并不断增加。然而,在这两种情况下,模型每次都预测完全相同的分类(“戴眼镜”)(即使在训练/验证集中的图像上),始终具有 100% 的置信水平(每个标签正好是 1时间)。
我对神经网络进行图像分类的经验并不多,所以我不太确定如何解决这个问题。我尝试从我的数据集中打印一些值及其各自的标签,并且标签确实包含两个标签(0 和 1)。因此,我认为这可能是我的模型的问题,但我自己并不能真正弄清楚。我尝试了不同的优化器(主要是 Adam,SGD)、越来越小的学习率、不同的动量值、更少/更多的卷积层以及填充和 kernel_initializer 的不同参数、不同的批量大小......快速提高精度或静态精度。
我的代码如下:
#parameters
batch_size = 16
img_height = 180
img_width = 180
num_classes = 2
epochs = 10
#training data
train_db = tf.keras.preprocessing.image_dataset_from_directory(
`D:\archive\faces\`,
validation_split=0.2,
subset="training",
seed=123,
image_size=(img_height, img_width), color_mode = "grayscale",
batch_size=batch_size)
#validation data
val_db = tf.keras.preprocessing.image_dataset_from_directory(
`D:\archive\faces\`,
validation_split=0.2,
subset="validation",
seed=123,
image_size=(img_height, img_width), color_mode = "grayscale",
batch_size=batch_size)
#speeds up the model training
AUTOTUNE = tf.data.experimental.AUTOTUNE
train_db = train_db.cache().shuffle(1000).prefetch(buffer_size=AUTOTUNE)
val_db = val_db.cache().prefetch(buffer_size=AUTOTUNE)
#establishing the model
model = Sequential([
layers.experimental.preprocessing.Rescaling(1./255),
layers.Conv2D(16, (3,3), activation='relu', input_shape=(img_width, img_height, 1), kernel_initializer='he_uniform', padding='same'),
layers.MaxPooling2D(2, 2),
layers.Conv2D(32, (3,3), activation='relu', kernel_initializer='he_uniform', padding='same'),
layers.MaxPooling2D(2,2),
layers.Conv2D(64, (3,3), activation='relu', kernel_initializer='he_uniform', padding='same'),
layers.MaxPooling2D(2,2),
layers.Conv2D(64, (3,3), activation='relu', kernel_initializer='he_uniform', padding='same'),
layers.MaxPooling2D(2,2),
layers.Conv2D(64, (3,3), activation='relu', kernel_initializer='he_uniform', padding='same'),
layers.MaxPooling2D(2,2),
layers.Flatten(),
layers.Dense(512, activation='relu', kernel_initializer='he_uniform'),
layers.Dense(1, activation='sigmoid')
])
#different optimizer options
opt = tf.keras.optimizers.SGD(learning_rate=0.001, momentum=0.9)
opt2 = tf.keras.optimizers.Adam(learning_rate=0.001)
#compiling the model
model.compile(
optimizer=opt,
loss=tf.losses.BinaryCrossentropy(),
metrics='accuracy')
#training the model
model.fit(train_db,validation_data=val_db,epochs=epochs)
【问题讨论】:
【参考方案1】:因为您使用的是 loss=tf.losses.BinaryCrossentropy(),所以在 image_dataset_from_directory 中,您需要为 train_db 和 val_db 添加 label_mode='binary'。对于 val_db 添加 shuffle=False
【讨论】:
我试图添加这个,不幸的是无济于事。似乎确实有所作为的是使用了更少量的数据(实际数据集的 10%),现在它实际上预测了 0 和 1 之间的值。 尝试在model.fit中添加batch_size=batch_size以上是关于Keras CNN 精度要么是静态的,要么对于图像分类来说太高了的主要内容,如果未能解决你的问题,请参考以下文章