CNTK reader 用于 Python 中的 base64 编码图像

Question

我正在将 CNTK 的训练和评估配置从 Brainscript 迁移到 Python。因为我们的训练数据是在 map/reduce 框架中创建的，所以我将图像和标签存储在一个巨大的文本文件中，该文件包含 base64 编码图像作为其列之一。一切正常，但我仍然没有找到在 Python.

中进行等效操作的方法

我的 CNTK.exe 配置类似于 this example configuration:

deserializers = ({
        type = "Base64ImageDeserializer" ; module = "ImageReader"
        file = "myFile.tsv"
...

所有 Python 示例（例如 this one）都使用 ImageDeserializer，它从作为单个文件的图像中读取。我在 cntk.io 的 Python 代码中没有发现任何听起来像 base64 图像反序列化器的东西。

如何通过 Python 在 CNTK 中使用 base64 编码的图像？

相关问题：Brainscript Base64ImageDeserializer 接受在第一列中包含序列 ID 的文件，这对于我们在测试时识别单个示例至关重要。我如何在 Python 中使用它？

Answer 1

Python 的 Base64 反序列化器支持已合并到 master。有关示例用法，请参阅 /bindings/python/cntk/io/tests/io_tests.py test_base64_image_deserializer.

关于获取标签 - 目前没有简单的方法，您可以编写包含 ID 的 CNTKTextFormat。但这很麻烦，我们正在讨论如何简化它。

CNTK reader for base64 encoded images in Python