在 keras 中使用 CNN-LSTM 模型进行序列到序列分类

Posted 2023-03-13

技术标签:

【中文标题】在 keras 中使用 CNN-LSTM 模型进行序列到序列分类【英文标题】：Sequence to Sequence classification with CNN-LSTM model in keras 【发布时间】：2021-01-25 12:19:50 【问题描述】：

我正在处理 1000 个样本。每个样本都与一个具有 70 种不同生命体征和健康特征的人相关联，该人在 168 个不同的时间步长处测量。然后，对于每个时间步，我应该预测一个二进制标签。所以，输入和输出的形状是：

Input.shape = (1000, 168, 70)
Output.shape = (1000, 168, 1)

目标是使用 CNN 提取特征，然后将 LSTM 用于时间信息。然后我想为二进制分类应用一个密集层。我想为此任务应用 CNN-LSTM 模型。

以下是我试过的代码。

model = Sequential()                        
model.add(Conv1D(filters=16, kernel_size=5, strides=1, padding="same", input_shape=(168, 70), activation='relu'))
model.add(MaxPooling1D())
model.add(LSTM(64, return_sequences=True))
model.add(Dense(1, activation="sigmoid")) 

model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
model.fit(X_train_3D, Y_train_3D, batch_size=32, epochs=500, validation_data=(X_val_3D, Y_val_3D))

我是这个模型应用程序的新手，所以我确定我在这里做错了我找不到的事情。这是错误：

ValueError: logits and labels must have the same shape ((None, 84, 1) vs (None, 168, 1))

感谢任何帮助。

【问题讨论】：

【参考方案1】：

由于您使用的是return_sequences=True，这意味着LSTM 将返回形状为(batch_size, 84, 64) 的输出。这里的84 是由于您使用了Conv1D 参数。所以当你应用Dense 层和1 单位时，它会将最后一个维度减少到1，这意味着(batch_size, 84, 64) 在Dense 层应用后将变为(batch_size, 84, 1)。您要么不应该使用return_sequences=True，要么使用另一个/多个图层将输出展平为二维，然后再将其馈送到Dense 图层。

【讨论】：

以上是关于在 keras 中使用 CNN-LSTM 模型进行序列到序列分类的主要内容，如果未能解决你的问题，请参考以下文章