具有更大输入图像尺寸的 Caffe 预训练模型
Posted
技术标签:
【中文标题】具有更大输入图像尺寸的 Caffe 预训练模型【英文标题】:Caffe pretrained models with larger input image sizes 【发布时间】:2016-08-16 00:56:39 【问题描述】:您能否建议我一个经过训练的 CNN 模型,该模型在支持大于 400x400 像素的输入图像大小的更大数据集上进行训练?
在我的情况下,我的结构非常薄,如果我将图像重新缩放到标准尺寸,例如224x224 我会松开那些结构。
【问题讨论】:
如果您正在处理薄结构,为什么不尝试检测它们以仅关注它们。考虑使用更快的 RCNN 进行检测和分类 【参考方案1】:如果没有您的特定应用,很难为您指出合适的预训练模型。但是,独立于您的具体应用,我建议如下:
您不一定需要支持更大图像尺寸的预训练模型 - 根据您的应用程序,您无论如何都需要重新训练最后几层(即全连接层)。然而,卷积层(以及池化层、局部响应归一化层、ReLU 层等)与图像大小无关。因此,您可以将卷积层形成一个预训练模型(例如来自 AlexNet 或 reference BVLC model),并根据您的需要调整全连接层,然后仅重新训练那些。
不过,这里有一些图像尺寸较大的模型(您可以在Caffe Model Zoo 中找到所有这些模型)。但是,这些模型是否有用取决于您的应用程序。您可以查看这些模型的prototxt
文件以了解所需的确切图像大小。
【讨论】:
以上是关于具有更大输入图像尺寸的 Caffe 预训练模型的主要内容,如果未能解决你的问题,请参考以下文章