具有更大输入图像尺寸的 Caffe 预训练模型

Posted

技术标签:

【中文标题】具有更大输入图像尺寸的 Caffe 预训练模型【英文标题】:Caffe pretrained models with larger input image sizes 【发布时间】:2016-08-16 00:56:39 【问题描述】:

您能否建议我一个经过训练的 CNN 模型,该模型在支持大于 400x400 像素的输入图像大小的更大数据集上进行训练?

在我的情况下,我的结构非常薄,如果我将图像重新缩放到标准尺寸,例如224x224 我会松开那些结构。

【问题讨论】:

如果您正在处理薄结构,为什么不尝试检测它们以仅关注它们。考虑使用更快的 RCNN 进行检测和分类 【参考方案1】:

如果没有您的特定应用,很难为您指出合适的预训练模型。但是,独立于您的具体应用,我建议如下:

您不一定需要支持更大图像尺寸的预训练模型 - 根据您的应用程序,您无论如何都需要重新训练最后几层(即全连接层)。然而,卷积层(以及池化层、局部响应归一化层、ReLU 层等)与图像大小无关。因此,您可以将卷积层形成一个预训练模型(例如来自 AlexNet 或 reference BVLC model),并根据您的需要调整全连接层,然后仅重新训练那些。

不过,这里有一些图像尺寸较大的模型(您可以在Caffe Model Zoo 中找到所有这些模型)。但是,这些模型是否有用取决于您的应用程序。您可以查看这些模型的prototxt 文件以了解所需的确切图像大小。

Fully Convolutional Networks for Semantic Segmentation ParseNet: Looking wider to see better Holistically-Nested Edge Detection Constrained Convolutional Neural Networsk

【讨论】:

以上是关于具有更大输入图像尺寸的 Caffe 预训练模型的主要内容,如果未能解决你的问题,请参考以下文章

加载预训练模型后与可变输入尺寸相关的错误

当知识图谱遇上预训练语言模型

使用来自 Keras 应用程序的模型,无需预训练权重

用不同的通道替换预训练模型的输入层?

Tensorflow:在具有不同类别数量的新数据集上微调预训练模型

如何使用 Opencv dnn 模块调用 Caffe 预训练模型?