验证和评估准确性的差异

Difference in the Validation and Evaluation Accuracy

我正在使用预训练的 GoogLeNet,然后在我的数据集上对其进行微调以对 11 类 进行分类。验证数据集似乎给出了 "loss3/top1" 86.5%。但是当我在我的评估数据集上评估性能时,它给了我 77% 的准确率。无论我做了什么更改 train_val.prototxt,我都在 deploy.prototxt 中做了相同的更改。验证和评估准确性之间的差异是正常的还是我做错了什么? 有什么建议吗?

为了在验证数据集上获得训练模型的公平估计,您需要以有意义的方式设置 test_itrtest_batch_size

因此,test_itr 应设置为:

Val_data / test_batch_Size

其中,Val_data 是验证数据集的大小,test_batch_Size 是在 batch_size 中为验证阶段设置的验证批量大小值。