张量流对象检测模型训练数据集中的重复图像

Repeating images in training dataset for tensorflow object detection models

我正在训练一个张量流对象检测模型,该模型已经使用 COCO 进行了预训练以识别单个 type/class 对象。我的数据集中的某些图像中有多个此类对象的实例。

鉴于训练中使用的每条记录都有一个边界框,我想知道最好的方法是什么来处理我的图像中可能有多个相同 class 对象这一事实。

Should I use the same image for multiple records?

不,因为图像中任何未标注为对象的东西都被归类为背景,这是隐式对象type/class。因此,当您使用具有对象的图像训练模型时,但该对象未正确注释时,模型的性能会降低(因为模型将该对象和其他类似实体视为背景)

Could that be problematic when training?

是的,这个问题会以不好的方式影响模型的性能。事实上,一件好事是添加一些其中没有任何对象的图像,然后让模型在没有边界框实例的情况下作为背景进行训练。

Would it be better if I could split said images so that they only contained one object?

是的,这会有所帮助。此外,您可以考虑为每个图像添加多个边界框。但切勿在没有注释边界框的情况下留下任何对象,即使该对象被截断或遮挡。