如何对不同上下文的查询使用序列标签?

How to use Sequence labeling for queries with different context?

我正在使用 pycrfsuite(BIO 标记)和 nltk 创建一个序列标记程序。该程序应该能够处理具有不同上下文的查询。

我为每个上下文训练了不同的模型并分别保存了它们,一个模型用于处理航班预订查询,一个模型用于处理查询以发送短信等。

我有一个界面,用户可以在其中输入来自任何上下文的查询。除了迭代每个模型之外,任何人都可以建议我为特定查询查找和使用相应模型的最佳方法吗?还是我完全错误地使用了不同的模型?

传统上解决此问题的方法是使用 "intent" 分类器来确定查询的意图。该分类器经过训练可以将查询路由到适当的序列模型。然后你可以做的是将查询发送到意图分类器预测的前 3 个模型,并查看其中哪些模型给出了合理的结果。