用于图像分类和语义分割的图像预处理
image pre-processing for image classification and semantic segmentation
针对图像分类、语义分割等不同类型的图像相关工作训练深度学习模型,需要进行哪些预处理工作?
例如,如果我想训练一个用于语义分割的网络,我是否需要将图像值(通常表示为 nd 数组)缩放到 [0,1]
范围,或者将其保持为 [0,255]
范围?谢谢
完成的事情很少,但实际上没有一组或固定的预处理组总是完成。
这里有一些例子:
- 减去均值图像,
- 除以方差(不太常见)
- 标准化值
- 如果使用 "real" 图像(如人物图像),则水平翻转
- 随机裁剪
- 翻译
针对图像分类、语义分割等不同类型的图像相关工作训练深度学习模型,需要进行哪些预处理工作?
例如,如果我想训练一个用于语义分割的网络,我是否需要将图像值(通常表示为 nd 数组)缩放到 [0,1]
范围,或者将其保持为 [0,255]
范围?谢谢
完成的事情很少,但实际上没有一组或固定的预处理组总是完成。
这里有一些例子:
- 减去均值图像,
- 除以方差(不太常见)
- 标准化值
- 如果使用 "real" 图像(如人物图像),则水平翻转
- 随机裁剪
- 翻译