神经网络中图像的默认输入尺寸?

Default input dimensions for an image in Neural networks?

阅读 PyTorch 书籍时,我偶然发现了作者更改轴顺序的代码。

img_t.permute(1, 2, 0)(将轴的顺序从 C × H × W 更改为 H × W × C)

神经网络中输入图像的默认输入尺寸是 H x W x C 吗?

在 PyTorch 中,输入的形状为 N x C x H x W。因此 N 是批量大小,C 是图像通道数,如您所知,H 和 W 是高度和宽度。但是当你使用例如 cv2 时,图像的默认形状是 HxWxC 所以你需要为 pytorch 交换尺寸。