如何将视频帧分类为包含对象的帧和无意义的帧

How to classify video frames to frames containing objects and meaningless frames

我想对视频帧做一些检测和分类工作,但是视频中的帧太多需要处理,所以我想找出哪些帧包含对象,哪些帧是无意义的(不包含对象)或面孔),这样我就可以通过检测更少的帧来节省一些时间。

我已经测试了 Gist 和 SVM,试图从森林场景图像(15 个场景数据集)中分离出包含狗(pascal voc)的图像,但是测试数据的准确性非常低(低于 50%)。

是否还有适合此任务的其他功能或算法?还有适合这个任务的数据集吗?

您可以研究视觉显着性检测方法。如果存在显着性簇,则这些帧可能包含对象。