图像序列的分类(固定数量)

Posted

技术标签:

【中文标题】图像序列的分类(固定数量)【英文标题】:Classification of a sequence of images (fixed number) 【发布时间】:2020-05-14 03:59:38 【问题描述】:

我使用来自 tensorflow_hub 的预训练 resnet50 成功训练了 CNN 进行单个图像分类。

现在我的目标是向我的网络提供一个按时间顺序的图像序列(不是视频)作为输入,以对主题的行为进行分类。 每个序列由每 100 毫秒拍摄的 20 张图像组成。

什么是最好的神经网络?我在哪里可以找到与我的类似问题的文档/示例?

【问题讨论】:

【参考方案1】:

只要有顺序数据,某种类型的循环神经网络就是很好的候选者(通常采用 LSTM 的形式)。

您的模型可能看起来像 CNN-LSTM 的组合,因为您的图片具有某种顺序关系。

Here is a link to some examples and tutorials。他将在他的示例中设置一个 CNN,但您可能可以装配您的架构以使用您已经制作的 resNet。尽管您处理的不是视频,但您的问题共享同一个域。

Here 是一篇论文,它使用了上面描述的神经网络架构,您可能会觉得有用。

【讨论】:

谢谢,非常有趣。这似乎正是我想要的。在应用示例中,我看到封装了 CNN 模型的 TimeDistributed(cnn, ...):CNN 可以预训练吗? 如果您当前拥有的模型可以将输入向量输出到 LSTM,我看不出问题。 这正是我想要理解的。我找到了另一篇论文:researchgate.net/publication/…。这似乎是可能的。我的目标是创建一个具有这种形状的网络:[ TimeDistributed(CNN pretrained (可能与我在前一个案例中使用的相同)) -> LSTM -> Dense layer(s) ] 如果可能的话,我会使用相同的网络对于卷积层,因为网络是在相同的图像上训练的,但是是一张一张的,而不是“时间相关的序列”。

以上是关于图像序列的分类(固定数量)的主要内容,如果未能解决你的问题,请参考以下文章

在 TensorFlow 中使用多对多 LSTM 进行视频分类

LSTM 时间序列分类 val_acc 固定或小于 0.5

使用不同尺寸但相同数量的 HoG 特征的图像训练分类器

在训练 SVM 对图像进行分类时设置具有序列错误的数组元素

目标检测算法盘点

在图像分类中如何计算正确的标签? [关闭]