每个 .tfrecord 文件有多少张图像(用于训练 tensorflow 对象检测 API)?

How many images per .tfrecord file (for training tensorflow object detection API)?

在对象检测API using your own data set 文档中,描述了如何将整个训练集分成多个文件。然而,他们只说

"When you have more than a few thousand examples, it is beneficial to shard your dataset into multiple files: ..."

我想知道作为要训练的图像数量函数的分割数量。

就每个文件的实例数而言,是否存在最佳大小,或者文件大小更重要?

(以防万一,我最终想在 Google AI 平台上训练对象检测 API 模型。)谢谢。

(1) 拥有比 workers/gpus 多的文件,以便每个工作人员可以读取自己的文件。

(2) 尽量有几百MB的文件,因为GCS的吞吐量高,但第一个字节的时间很长。