CNN 与 MNIST 数据集的结构思想

Structural idea for CNN with MNIST dataset

我正在尝试创建一个卷积神经网络来识别手写数字(来自 MNIST 数据集),我想知道什么是旋转数字的好结构,现在我只能想更深入,添加更多层。关于如何构建这样一个 CNN 来识别旋转的 MNIST 数字有什么想法吗?我正在使用张量流。谢谢。

您可以使用任何标准架构,例如 keras/mnist_cnn.py,并在旋转数据上对其进行训练。

在 keras 示例中,对于通道最后格式,您可以这样做:

x_train = np.rot90(x_train, k=1, axes=(1,2))

例如将输入旋转 90 度。