具有更大输入图像尺寸的 Caffe 预训练模型

Caffe pretrained models with larger input image sizes

你能给我推荐一个训练有素的 CNN 模型吗?它是在支持输入图像大小 >400x400 像素的更大数据集上训练的?

在我的例子中,如果我将图像重新缩放到标准尺寸,例如224x224 我会松开那些结构。

如果没有您的具体应用,很难为您指明合适的预训练模型。但是,独立于您的具体应用,我建议如下:

您不一定需要支持更大图像尺寸的预训练模型 - 根据您的应用程序,您无论如何都需要重新训练最后几层(即全连接层)。然而,卷积层(以及池化层、局部响应归一化层、ReLU 层等)与图像大小无关。因此,您可以将卷积层形成一个预训练模型(例如来自 AlexNet or the reference BVLC model),并根据您的需要调整完全连接的层,并仅重新训练那些。

不过,这里有一些图像尺寸较大的模型(您可以在 Caffe Model Zoo 中找到所有模型)。然而,这些模型是否有用取决于您的应用。您可以查看这些模型的 prototxt 文件以了解所需的确切图像尺寸。