用于语义分割的单热标签
one-hot-labelling for semantic segmentation
在阅读语义分割论文时,有时我会读到像 one-hot labeling for mask images 这样的术语。我不清楚这到底是什么意思?在阅读一些实现时,我可以看到它们通常是 rows*columns*2
的形状
我的猜测是一个通道对应前景,另一个通道对应背景。那正确吗?此外,我怎么知道哪个是前景?如果现有的训练集只有形状rows*columns*1
。如何将其转换为这种格式,即 rows*columns*2
?我正在做的只是使用 newimage[:,:,:,0] = original_image
和 newimage[:,:,:,1] = 1-original_image
。但是不知道对不对?
1、2、3、4、5 等分类标签没有任何自然顺序。因此,使用这些数字可能意味着标签 5 大于标签 1,但冰箱和狗只是两个没有自然顺序的标签。
所以我们将标签 1,2,3,4,5 转换为
[1,0,0,0,0], [0,1,0,0,0], ...,[0,0,0,0,1]
所以现在它们只是指向某个方向的向量,这使得逻辑回归和其他损失函数更容易使用。
你也可以用行*列*1编码前景背景
只需将前景值设置为 1,将背景值设置为 0,然后我们就有了前景背景蒙版。
我需要看一个何时使用 rows*columns*2 的例子,因为那个并不常见,并且可能会因您看到它的位置而异。
在阅读语义分割论文时,有时我会读到像 one-hot labeling for mask images 这样的术语。我不清楚这到底是什么意思?在阅读一些实现时,我可以看到它们通常是 rows*columns*2
我的猜测是一个通道对应前景,另一个通道对应背景。那正确吗?此外,我怎么知道哪个是前景?如果现有的训练集只有形状rows*columns*1
。如何将其转换为这种格式,即 rows*columns*2
?我正在做的只是使用 newimage[:,:,:,0] = original_image
和 newimage[:,:,:,1] = 1-original_image
。但是不知道对不对?
1、2、3、4、5 等分类标签没有任何自然顺序。因此,使用这些数字可能意味着标签 5 大于标签 1,但冰箱和狗只是两个没有自然顺序的标签。
所以我们将标签 1,2,3,4,5 转换为
[1,0,0,0,0], [0,1,0,0,0], ...,[0,0,0,0,1]
所以现在它们只是指向某个方向的向量,这使得逻辑回归和其他损失函数更容易使用。
你也可以用行*列*1编码前景背景
只需将前景值设置为 1,将背景值设置为 0,然后我们就有了前景背景蒙版。
我需要看一个何时使用 rows*columns*2 的例子,因为那个并不常见,并且可能会因您看到它的位置而异。