在cnn之后连接循环层，tf.expand_dims做什么？

Question

我想使用一个模型来 class 化八个 class 图像。我认为在循环层之前使用卷积层可以解决我的问题。但是，在卷积层或密集层之后立即使用循环层会导致张量流出现以下错误。

Input 0 is incompatible with layer simple_rnn_1: expected ndim=3, found ndim=2

我在 Lambda 层内使用 Tensorflow expand_dims() 函数解决了这个问题。它似乎工作正常，但我想确定我的模型是否正常工作。尽管查看了相关文档，但我无法理解 expand_dims() 为使模型正常工作所做的工作。

from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Dropout, Flatten, Dense, Lambda, SimpleRNN
from tensorflow import expand_dims

def create_model():
    model = Sequential()
    model.add(Conv2D(32, (3, 3), input_shape=(50, 50, 1), padding='same',
                     activation='relu'))
    model.add(Conv2D(32, (3, 3), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.25))

    model.add(Conv2D(64, (3, 3), padding='same', activation='relu'))
    model.add(Conv2D(64, (3, 3), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.25))

    model.add(Flatten())
    model.add(Lambda(lambda x: expand_dims(model.output, axis=-1)))
    model.add(SimpleRNN(64, return_sequences=False))

    model.add(Dense(units=8, activation='softmax'))

    model.compile(optimizer='adam', loss='categorical_crossentropy',
                  metrics=['accuracy'])

    return model

我想使用循环层（LSTM、GRU、其他循环模型）将 CNN 输出解释为顺序信息。我将 Lambda 层与 expand_dims() 一起使用是否正确？

Answer 1

Flatten 层将图像的维度减少到（批处理长度、特征维度），循环神经网络期望输入有 3 个维度而不是 2 个维度，因为它需要一个新维度用于时间序列输入如（批处理长度、时间维度、特征维度）

expand_dims 只是添加一个额外的维度，将您的扁平化输出转换为（批处理长度，特征维度，1）。这意味着 RNN 现在可以工作了，它会将特征维度视为数据的时间维度，从而以有序的方式抛出它们并按照您的预期进行。

在cnn之后连接循环层，tf.expand_dims做什么？

Connecting recurrent layer after cnn, what does tf.expand_dims do?

python

conv-neural-network

keras

tensorflow

recurrent-neural-network