图像张量的形状为 (64, 64) 是什么意思?这是否意味着没有渠道?

What does it mean for the shape of an image tensor to be (64, 64)? Does that mean there are no channels?

我正在探索数据集的图像:Tiny Imagenet 我发现大多数图像张量的形状为 (64, 64, 3),即高度和宽度分别为 64 和 64 的图像以及三个通道用于红色、绿色和蓝色。但是数据集中的一些图像张量具有形状 (64, 64)。

是不是说没有渠道了?怎么可能?

编辑 - 我下载了这张张量形状 (64, 64) 的图像:

编辑 - 它是否有可能像 Lab 一样具有其他颜色 space 的一个通道? (这里b指的是从蓝到黄的颜色)

通常,它等同于 (64, 64, 1) 但大多数库会折叠最后一个轴。这意味着你只有一个通道,可能是一张灰度图像。您的数据集是否可能混合了 RGB 和灰度图像?

你有一个通道维度 - 只有它是 shape=1 - 你有一个单一的颜色通道,这意味着这是一个灰度图像。

如果您使用PIL.Image读取图像,您可以通过

强制它具有三个通道
Image.open(filename).convert('RGB')

您将有 shape 个 (64, 64, 3),但请注意,所有频道都是相同的。