序列分类问题选择哪个损失函数？

Which Loss function to choose for Sequence Classification Problem?

我的问题如下：输入：[字符序列]

输出：[字符序列]

输入和输出都是 BOW 表示。

例如 X=[12,3,4,5,6] ---> Y= [1,4,5,7,8]

我计划使用 Keras LSTM 完成上述任务。

我的损失函数应该是什么？

最标准的方法是使用softmax对输出分布进行建模，合适的损失函数是分类交叉熵。

标准分类交叉熵期望目标为单热向量。如果要直接使用 Y 中的索引，请使用稀疏分类交叉熵。

（请参阅 this tutorial 中的示例二，它似乎完全符合您的要求。）