Keras LSTM 层的输入形状应该是什么样的
How should the input shape of Keras LSTM layer looks like
我已经阅读了一段时间关于使用 tf.keras
训练 LSTM
模型的内容,我确实使用了相同的框架来解决使用简单 feedforward NN
架构的回归问题,我非常理解我应该如何为此类模型准备输入数据,但是在训练时 LSTM
,我对输入的形状感到很困惑。
有很多需要注意的地方:time steps
、number of samples
、batch size
、number of units
等。此外还有很多参数为LSTM
keras
我还不清楚的图层,如下例所示:
model.add(keras.layers.LSTM(units=3, batch_input_shape=(8,2,10), return_sequence=True, stateful= True))
所以我有以下外汇数据结构,但我不知道如何为 LSTM 模型正确重塑它。
open | close | high | low | volume | i1 | i2 | i3 | ... | i30 | nextClose
这些特征代表了某个货币对的open/close/high/low价格,除了成交量和从i1 -> i30的30个不同指标的值,所有这些特征都对应一个小步价。除了 nextClose 功能代表我希望预测的下一个 minuet tick 收盘价值。
Q1:谁能解释一下输入数据应该如何整形的一般概念,以及所有这些必需参数是什么(时间步长、批量大小.. .)?
问题 2: 我认为一个简单的例子可能很棒,我上面的数据结构应该如何重塑以看起来像 LSTM 的有效输入?
经过大量搜索后,我在图表中找到了 keras LSTM
的出色摘要,这非常有帮助。在 Keras_LSTM_Diagram git 存储库中检查它。
我已经阅读了一段时间关于使用 tf.keras
训练 LSTM
模型的内容,我确实使用了相同的框架来解决使用简单 feedforward NN
架构的回归问题,我非常理解我应该如何为此类模型准备输入数据,但是在训练时 LSTM
,我对输入的形状感到很困惑。
有很多需要注意的地方:time steps
、number of samples
、batch size
、number of units
等。此外还有很多参数为LSTM
keras
我还不清楚的图层,如下例所示:
model.add(keras.layers.LSTM(units=3, batch_input_shape=(8,2,10), return_sequence=True, stateful= True))
所以我有以下外汇数据结构,但我不知道如何为 LSTM 模型正确重塑它。
open | close | high | low | volume | i1 | i2 | i3 | ... | i30 | nextClose
这些特征代表了某个货币对的open/close/high/low价格,除了成交量和从i1 -> i30的30个不同指标的值,所有这些特征都对应一个小步价。除了 nextClose 功能代表我希望预测的下一个 minuet tick 收盘价值。
Q1:谁能解释一下输入数据应该如何整形的一般概念,以及所有这些必需参数是什么(时间步长、批量大小.. .)?
问题 2: 我认为一个简单的例子可能很棒,我上面的数据结构应该如何重塑以看起来像 LSTM 的有效输入?
经过大量搜索后,我在图表中找到了 keras LSTM
的出色摘要,这非常有帮助。在 Keras_LSTM_Diagram git 存储库中检查它。