序列分类问题选择哪个损失函数?

Which Loss function to choose for Sequence Classification Problem?

我的问题如下: 输入:[字符序列]

输出:[字符序列]

输入和输出都是 BOW 表示。

例如 X=[12,3,4,5,6] ---> Y= [1,4,5,7,8]

我计划使用 Keras LSTM 完成上述任务。

我的损失函数应该是什么?

最标准的方法是使用softmax对输出分布进行建模,合适的损失函数是分类交叉熵。

标准分类交叉熵期望目标为单热向量。如果要直接使用 Y 中的索引,请使用稀疏分类交叉熵。

(请参阅 this tutorial 中的示例二,它似乎完全符合您的要求。)