OOV 词的词嵌入

Word embedding for OOV words

我已经从语料库生成了词向量,但我面临着很多词的词汇量问题。如何使用现有的词嵌入为 OOV 词动态生成词向量?

一个非常晚的答案(甚至不是你正在寻找的答案)但是,使用 skip-gram 模型你问的几乎是不可能的,因为每个词本身就是一个不同的实体。

您要求的功能开箱即用 FastText 即可完成。它使用 n-grams.

生成 OOV 词向量

Gensim 有高级 API 使用 FastText。