张量流对象检测模型训练数据集中的重复图像
Repeating images in training dataset for tensorflow object detection models
我正在训练一个张量流对象检测模型,该模型已经使用 COCO 进行了预训练以识别单个 type/class 对象。我的数据集中的某些图像中有多个此类对象的实例。
鉴于训练中使用的每条记录都有一个边界框,我想知道最好的方法是什么来处理我的图像中可能有多个相同 class 对象这一事实。
- 我应该为多个记录使用同一张图片吗?
- 训练时会不会有问题?
- 如果我可以将所述图像分割成只包含一个对象会更好吗?
Should I use the same image for multiple records?
不,因为图像中任何未标注为对象的东西都被归类为背景,这是隐式对象type/class。因此,当您使用具有对象的图像训练模型时,但该对象未正确注释时,模型的性能会降低(因为模型将该对象和其他类似实体视为背景)
Could that be problematic when training?
是的,这个问题会以不好的方式影响模型的性能。事实上,一件好事是添加一些其中没有任何对象的图像,然后让模型在没有边界框实例的情况下作为背景进行训练。
Would it be better if I could split said images so that they only contained one object?
是的,这会有所帮助。此外,您可以考虑为每个图像添加多个边界框。但切勿在没有注释边界框的情况下留下任何对象,即使该对象被截断或遮挡。
我正在训练一个张量流对象检测模型,该模型已经使用 COCO 进行了预训练以识别单个 type/class 对象。我的数据集中的某些图像中有多个此类对象的实例。
鉴于训练中使用的每条记录都有一个边界框,我想知道最好的方法是什么来处理我的图像中可能有多个相同 class 对象这一事实。
- 我应该为多个记录使用同一张图片吗?
- 训练时会不会有问题?
- 如果我可以将所述图像分割成只包含一个对象会更好吗?
Should I use the same image for multiple records?
不,因为图像中任何未标注为对象的东西都被归类为背景,这是隐式对象type/class。因此,当您使用具有对象的图像训练模型时,但该对象未正确注释时,模型的性能会降低(因为模型将该对象和其他类似实体视为背景)
Could that be problematic when training?
是的,这个问题会以不好的方式影响模型的性能。事实上,一件好事是添加一些其中没有任何对象的图像,然后让模型在没有边界框实例的情况下作为背景进行训练。
Would it be better if I could split said images so that they only contained one object?
是的,这会有所帮助。此外,您可以考虑为每个图像添加多个边界框。但切勿在没有注释边界框的情况下留下任何对象,即使该对象被截断或遮挡。