YOLO:要么overfits要么underfits,增加batch还是增加sample image pool?

YOLO : Either overfits or underfits, increase batch or increase sample image pool?

我正在尝试训练我的 yolo 模型来识别灭火器并将其标记为 "Fire Safety"。目前是我得到过拟合或欠拟合的图像(见下文)。

我的带有注释的样本图像大小约为 1500

yolo-new.cfg 配置宽度=608 和高度=608

并且我已经使用以下命令进行了训练:

python flow --model cfg/yolo-new.cfg --labels one_label.txt --train --trainer adam --dataset "C://Users//G//Desktop//Development//ML//YOLO//BBox-Label-Tool//Images//002" --annotation "C://Users//G//Desktop//Development//ML//YOLO//BBox-Label-Tool//AnnotationsXML//002" --batch 4 --gpu 0.8

所以在 13000 步之后:

所以我去验证我的结果,这就是我得到的(检查点 13000):

所以也许我认为这可能是严重过度拟合的情况,因此我遍历检查点以查看哪个具有最接近的拟合。

这是我使用检查点 6500 得到的结果

这是我使用检查点 6000 得到的结果

这是我使用检查点 5500 得到的结果

因此,如您所见,检查点 6000 是我的最佳结果,但还不够好。我该如何改进?增加批量大小?(我的 GPU 1070Ti 无法处理。发生 Cuda 内存不足)有解决此问题的想法吗?

使用 Yolov3 训练我的图像集解决了我的问题。 https://github.com/AlexeyAB/darknet

有一点要注意,标注时不要留空,这可能是检测没有按计划进行的原因之一。