用于图像分类和语义分割的图像预处理

image pre-processing for image classification and semantic segmentation

针对图像分类、语义分割等不同类型的图像相关工作训练深度学习模型,需要进行哪些预处理工作?

例如,如果我想训练一个用于语义分割的网络,我是否需要将图像值(通常表示为 nd 数组)缩放到 [0,1] 范围,或者将其保持为 [0,255]范围?谢谢

完成的事情很少,但实际上没有一组或固定的预处理组总是完成。

这里有一些例子:

  • 减去均值图像,
  • 除以方差(不太常见)
  • 标准化值
  • 如果使用 "real" 图像(如人物图像),则水平翻转
  • 随机裁剪
  • 翻译