图像张量的形状为 (64, 64) 是什么意思?这是否意味着没有渠道?
What does it mean for the shape of an image tensor to be (64, 64)? Does that mean there are no channels?
我正在探索数据集的图像:Tiny Imagenet 我发现大多数图像张量的形状为 (64, 64, 3),即高度和宽度分别为 64 和 64 的图像以及三个通道用于红色、绿色和蓝色。但是数据集中的一些图像张量具有形状 (64, 64)。
是不是说没有渠道了?怎么可能?
编辑 - 我下载了这张张量形状 (64, 64) 的图像:
编辑 - 它是否有可能像 Lab 一样具有其他颜色 space 的一个通道? (这里b指的是从蓝到黄的颜色)
通常,它等同于 (64, 64, 1) 但大多数库会折叠最后一个轴。这意味着你只有一个通道,可能是一张灰度图像。您的数据集是否可能混合了 RGB 和灰度图像?
你有一个通道维度 - 只有它是 shape
=1 - 你有一个单一的颜色通道,这意味着这是一个灰度图像。
如果您使用PIL.Image
读取图像,您可以通过
强制它具有三个通道
Image.open(filename).convert('RGB')
您将有 shape
个 (64, 64, 3),但请注意,所有频道都是相同的。
我正在探索数据集的图像:Tiny Imagenet 我发现大多数图像张量的形状为 (64, 64, 3),即高度和宽度分别为 64 和 64 的图像以及三个通道用于红色、绿色和蓝色。但是数据集中的一些图像张量具有形状 (64, 64)。
是不是说没有渠道了?怎么可能?
编辑 - 我下载了这张张量形状 (64, 64) 的图像:
编辑 - 它是否有可能像 Lab 一样具有其他颜色 space 的一个通道? (这里b指的是从蓝到黄的颜色)
通常,它等同于 (64, 64, 1) 但大多数库会折叠最后一个轴。这意味着你只有一个通道,可能是一张灰度图像。您的数据集是否可能混合了 RGB 和灰度图像?
你有一个通道维度 - 只有它是 shape
=1 - 你有一个单一的颜色通道,这意味着这是一个灰度图像。
如果您使用PIL.Image
读取图像,您可以通过
Image.open(filename).convert('RGB')
您将有 shape
个 (64, 64, 3),但请注意,所有频道都是相同的。