Keras - 大型图像和蒙版数据集生成器

Keras - Generator for large dataset of Images and Masks

我正在尝试构建一个模型,该模型的输入和输出(遮罩)都有图像。 由于数据集的大小和我有限的内存,我尝试使用 the Generator Approach introduced in the Keras Documentation:

# Provide the same seed and keyword arguments to the fit and flow methods
seed = 1

image_generator = image_datagen.flow_from_directory(
    'data/images',
    class_mode=None,
    seed=seed)

mask_generator = mask_datagen.flow_from_directory(
    'data/masks',
    class_mode=None,
    seed=seed)

# combine generators into one which yields image and masks
train_generator = zip(image_generator, mask_generator)

model.fit_generator(
    train_generator,
    samples_per_epoch=2000,
    nb_epoch=50)

一切似乎都正常,除非代码到达这一行:

train_generator = zip(image_generator, mask_generator)

似乎压缩这两个列表的过程显式地使它们生成它们的内容并且系统开始消耗大量 RAM 直到它耗尽内存。

使用生成器的目的是避免 运行 内存不足,而这段代码恰恰相反。

有什么办法可以解决这个问题吗?

您可以使用 itertools.izip() 到 return 迭代器而不是列表。

itertools.izip(*iterables)

Make an iterator that aggregates elements from each of the iterables. Like zip() except that it returns an iterator instead of a list. Used for lock-step iteration over several iterables at a time.