在cnn之后连接循环层,tf.expand_dims做什么?
Connecting recurrent layer after cnn, what does tf.expand_dims do?
我想使用一个模型来 class 化八个 class 图像。我认为在循环层之前使用卷积层可以解决我的问题。但是,在卷积层或密集层之后立即使用循环层会导致张量流出现以下错误。
Input 0 is incompatible with layer simple_rnn_1: expected ndim=3, found ndim=2
我在 Lambda 层内使用 Tensorflow expand_dims()
函数解决了这个问题。它似乎工作正常,但我想确定我的模型是否正常工作。尽管查看了相关文档,但我无法理解 expand_dims()
为使模型正常工作所做的工作。
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Dropout, Flatten, Dense, Lambda, SimpleRNN
from tensorflow import expand_dims
def create_model():
model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=(50, 50, 1), padding='same',
activation='relu'))
model.add(Conv2D(32, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))
model.add(Conv2D(64, (3, 3), padding='same', activation='relu'))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Lambda(lambda x: expand_dims(model.output, axis=-1)))
model.add(SimpleRNN(64, return_sequences=False))
model.add(Dense(units=8, activation='softmax'))
model.compile(optimizer='adam', loss='categorical_crossentropy',
metrics=['accuracy'])
return model
我想使用循环层(LSTM、GRU、其他循环模型)将 CNN 输出解释为顺序信息。我将 Lambda 层与 expand_dims()
一起使用是否正确?
Flatten 层将图像的维度减少到(批处理长度、特征维度),循环神经网络期望输入有 3 个维度而不是 2 个维度,因为它需要一个新维度用于时间序列输入如(批处理长度、时间维度、特征维度)
expand_dims
只是添加一个额外的维度,将您的扁平化输出转换为(批处理长度,特征维度,1)。这意味着 RNN 现在可以工作了,它会将特征维度视为数据的时间维度,从而以有序的方式抛出它们并按照您的预期进行。
我想使用一个模型来 class 化八个 class 图像。我认为在循环层之前使用卷积层可以解决我的问题。但是,在卷积层或密集层之后立即使用循环层会导致张量流出现以下错误。
Input 0 is incompatible with layer simple_rnn_1: expected ndim=3, found ndim=2
我在 Lambda 层内使用 Tensorflow expand_dims()
函数解决了这个问题。它似乎工作正常,但我想确定我的模型是否正常工作。尽管查看了相关文档,但我无法理解 expand_dims()
为使模型正常工作所做的工作。
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Dropout, Flatten, Dense, Lambda, SimpleRNN
from tensorflow import expand_dims
def create_model():
model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=(50, 50, 1), padding='same',
activation='relu'))
model.add(Conv2D(32, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))
model.add(Conv2D(64, (3, 3), padding='same', activation='relu'))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Lambda(lambda x: expand_dims(model.output, axis=-1)))
model.add(SimpleRNN(64, return_sequences=False))
model.add(Dense(units=8, activation='softmax'))
model.compile(optimizer='adam', loss='categorical_crossentropy',
metrics=['accuracy'])
return model
我想使用循环层(LSTM、GRU、其他循环模型)将 CNN 输出解释为顺序信息。我将 Lambda 层与 expand_dims()
一起使用是否正确?
Flatten 层将图像的维度减少到(批处理长度、特征维度),循环神经网络期望输入有 3 个维度而不是 2 个维度,因为它需要一个新维度用于时间序列输入如(批处理长度、时间维度、特征维度)
expand_dims
只是添加一个额外的维度,将您的扁平化输出转换为(批处理长度,特征维度,1)。这意味着 RNN 现在可以工作了,它会将特征维度视为数据的时间维度,从而以有序的方式抛出它们并按照您的预期进行。