每个 .tfrecord 文件有多少张图像(用于训练 tensorflow 对象检测 API)?
How many images per .tfrecord file (for training tensorflow object detection API)?
在对象检测API using your own data set 文档中,描述了如何将整个训练集分成多个文件。然而,他们只说
"When you have more than a few thousand examples, it is beneficial to shard your dataset into multiple files: ..."
我想知道作为要训练的图像数量函数的分割数量。
就每个文件的实例数而言,是否存在最佳大小,或者文件大小更重要?
(以防万一,我最终想在 Google AI 平台上训练对象检测 API 模型。)谢谢。
(1) 拥有比 workers/gpus 多的文件,以便每个工作人员可以读取自己的文件。
(2) 尽量有几百MB的文件,因为GCS的吞吐量高,但第一个字节的时间很长。
在对象检测API using your own data set 文档中,描述了如何将整个训练集分成多个文件。然而,他们只说
"When you have more than a few thousand examples, it is beneficial to shard your dataset into multiple files: ..."
我想知道作为要训练的图像数量函数的分割数量。
就每个文件的实例数而言,是否存在最佳大小,或者文件大小更重要?
(以防万一,我最终想在 Google AI 平台上训练对象检测 API 模型。)谢谢。
(1) 拥有比 workers/gpus 多的文件,以便每个工作人员可以读取自己的文件。
(2) 尽量有几百MB的文件,因为GCS的吞吐量高,但第一个字节的时间很长。