如何修复'ValueError:输入张量必须具有等级 4'?
Posted
技术标签:
【中文标题】如何修复\'ValueError:输入张量必须具有等级 4\'?【英文标题】:How to fix the 'ValueError: input tensor must have rank 4'?如何修复'ValueError:输入张量必须具有等级 4'? 【发布时间】:2019-12-19 10:26:12 【问题描述】:目前我正在尝试将 CNN 与 LSTM 模型结合起来进行视频分类,但在 Google 和 *** 上进行搜索后,我无法找到解决问题的方法
下面是整个代码:
#Importing libraries
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, LSTM, TimeDistributed
from keras.layers import Activation, Dropout, Flatten, Dense
from keras import backend as K
#Shape of the image, based on 1920x1080
img_width, img_height = 224, 135
#Location of the frames split in a train and test folder
train_data_dir = './train'
validation_data_dir = './test'
#Data information
nb_train_samples = 46822
nb_validation_samples = 8994
timesteps = 1
epochs = 10
batch_size = 30
input_shape = (img_width, img_height, 3)
model = Sequential()
# define CNN model
model.add(TimeDistributed(Conv2D(132, (3, 3), input_shape=input_shape, activation='relu')))
model.add(TimeDistributed(MaxPooling2D(pool_size = (2, 2))))
model.add(TimeDistributed(Flatten()))
# define LSTM model
model.add(LSTM(132, return_sequences=True))
model.add(LSTM(132, return_sequences=True))
model.add(LSTM(132, return_sequences=True))
model.add(LSTM(132, return_sequences=True))
model.add(Dense(3, activation='softmax'))
model.build(input_shape)
model.summary()
model.compile(loss ='categorical_crossentropy', optimizer ='rmsprop', metrics =['accuracy'])
model.fit_generator(train_generator, steps_per_epoch = nb_train_samples // batch_size, epochs = epochs, validation_data = validation_generator, validation_steps = nb_validation_samples // batch_size)
train_datagen = ImageDataGenerator(rescale = 1. / 255, shear_range = 0.2, zoom_range = 0.2, horizontal_flip = True)
test_datagen = ImageDataGenerator(rescale = 1. / 255)
train_generator = train_datagen.flow_from_directory(train_data_dir, target_size =(img_width, img_height), batch_size = batch_size, class_mode ='categorical')
validation_generator = test_datagen.flow_from_directory(validation_data_dir, target_size =(img_width, img_height), batch_size = batch_size, class_mode ='categorical')
运行时出现的错误是:
回溯(最近一次通话最后一次): 文件“CNNLSTM.py”,第 36 行,在 model.build(input_shape) ...... ValueError: 输入张量必须有 4 级
我已添加 model.build(input_shape) 以避免此错误:
ValueError:此模型尚未构建。首先通过调用 build() 或使用一些数据调用 fit() 来构建模型。或者在第一层指定 input_shape 或 batch_input_shape 进行自动构建。
但正如在代码中可见的那样,我在模型的第一行应用了 input_shape。
希望这里有人能指出我做错了什么。
【问题讨论】:
【参考方案1】:您应该考虑三点:
您提到您正在进行视频分类。因此,模型的输入是一组图像/帧。所以输入的形状(即一个样本的形状)是:
input_shape = (n_frames, img_width, img_height, 3)
模型的第一层是 TimeDistributed
包装器,它包装了 Conv2D
层。因此,您必须为此层设置input_shape
参数:
model.add(TimeDistributed(Conv2D(132, (3, 3), activation='relu'), input_shape=input_shape))
build
方法需要批量形状作为参数,而不是单个输入样本的形状。因此,你应该写:
model.build((None,) + input_shape)
但是,如果您解决了第 2 点,那么您根本不需要调用 build
方法。
【讨论】:
感谢您的回复,这提供了解决方案!但是在进一步的步骤中,我又遇到了另一个错误,回到谷歌搜索;)【参考方案2】:正如您在错误消息 model.build
中看到的,需要 4D 张量作为输入,而您的输入形状是 input_shape = (img_width, img_height, 3)
3D。 Tensorflow 通常期望输入具有以下形状:(N, H, W, C),其中 N 是批量大小,H 和 W 分别是高度和宽度,C 是通道数。如果您只有一张图像,您可以将输入形状更改为input_shape = (1, img_width, img_height, 3)
,但通常处理批量图像更有效。
【讨论】:
感谢您的回复,似乎此选项也有效,但“今天”提供的答案首先应用并提供了解决方案。以上是关于如何修复'ValueError:输入张量必须具有等级 4'?的主要内容,如果未能解决你的问题,请参考以下文章
ValueError:无法为具有形状“(?,784)”的张量“x:0”提供形状(784,)的值
ValueError:模型的输出张量必须是TensorFlow`Layer`的输出
ValueError:无法为具有形状“(?,1)”的张量“Placeholder_1:0”提供形状(6165、5)的值
ValueError:无法为具有形状“(?,4)”的张量“Placeholder_36:0”提供形状(4,)的值
如何修复 Logits 和 Labels 必须具有相同的形状?
ValueError:在使用 tf.image.crop_to_bounding_box 时,张量转换为具有 dtype float32 的张量请求 dtype int32