Keras 的 Resnet 期望输入什么?

What Keras's Resnet expects as an input?

我正在尝试将 Keras 的 resnet 实现用于具有完全不同的一组图像(黑白 16 位)的迁移学习任务。那么 Keras 期望的输入是什么?具有 3 个通道和 -127-128 范围的图像(这就是我假设的以零为中心的 8 位图像)? 0-255?如果我超过这个范围之外的东西会怎样?

谢谢。

根据 Keras 文档中提供的 paper,您应该提供一个 224 x 224 RGB [0 - 225] 图像。实际维度排序取决于您在 Keras 安装中使用的后端。

数据准备如AlexNet中那样进行,因此从每个颜色通道中减去平均激活。 RGB 的平均向量是 103.939, 116.779, 123.68.

如果您的颜色值会扩展 -255, 255 范围 - 它可能会损害您的训练,因为网络未知的数据量级。但仍然 - 网络可以适应这种变化,但它通常会花费更多时间并使训练更加混乱。

在单色图像的情况下 - 一种常用的技术是将相同的通道重复 3 次,以使网络架构的维度合理。