具有更大输入图像尺寸的 Caffe 预训练模型

Posted 2023-03-12

技术标签:

【中文标题】具有更大输入图像尺寸的 Caffe 预训练模型【英文标题】：Caffe pretrained models with larger input image sizes 【发布时间】：2016-08-16 00:56:39 【问题描述】：

您能否建议我一个经过训练的 CNN 模型，该模型在支持大于 400x400 像素的输入图像大小的更大数据集上进行训练？

在我的情况下，我的结构非常薄，如果我将图像重新缩放到标准尺寸，例如224x224 我会松开那些结构。

【问题讨论】：

如果您正在处理薄结构，为什么不尝试检测它们以仅关注它们。考虑使用更快的 RCNN 进行检测和分类 【参考方案1】：

如果没有您的特定应用，很难为您指出合适的预训练模型。但是，独立于您的具体应用，我建议如下：

您不一定需要支持更大图像尺寸的预训练模型 - 根据您的应用程序，您无论如何都需要重新训练最后几层（即全连接层）。然而，卷积层（以及池化层、局部响应归一化层、ReLU 层等）与图像大小无关。因此，您可以将卷积层形成一个预训练模型（例如来自 AlexNet 或 reference BVLC model），并根据您的需要调整全连接层，然后仅重新训练那些。

不过，这里有一些图像尺寸较大的模型（您可以在Caffe Model Zoo 中找到所有这些模型）。但是，这些模型是否有用取决于您的应用程序。您可以查看这些模型的prototxt 文件以了解所需的确切图像大小。

Fully Convolutional Networks for Semantic Segmentation ParseNet: Looking wider to see better Holistically-Nested Edge Detection Constrained Convolutional Neural Networsk

【讨论】：

以上是关于具有更大输入图像尺寸的 Caffe 预训练模型的主要内容，如果未能解决你的问题，请参考以下文章

加载预训练模型后与可变输入尺寸相关的错误

当知识图谱遇上预训练语言模型

使用来自 Keras 应用程序的模型，无需预训练权重

用不同的通道替换预训练模型的输入层？

Tensorflow：在具有不同类别数量的新数据集上微调预训练模型

如何使用 Opencv dnn 模块调用 Caffe 预训练模型？