神经网络中图像的默认输入尺寸？

Default input dimensions for an image in Neural networks?

阅读 PyTorch 书籍时，我偶然发现了作者更改轴顺序的代码。

img_t.permute(1, 2, 0)（将轴的顺序从 C × H × W 更改为 H × W × C）

神经网络中输入图像的默认输入尺寸是 H x W x C 吗？

在 PyTorch 中，输入的形状为 N x C x H x W。因此 N 是批量大小，C 是图像通道数，如您所知，H 和 W 是高度和宽度。但是当你使用例如 cv2 时，图像的默认形状是 HxWxC 所以你需要为 pytorch 交换尺寸。