我已经从语料库生成了词向量,但我面临着很多词的词汇量问题。如何使用现有的词嵌入为 OOV 词动态生成词向量?
一个非常晚的答案(甚至不是你正在寻找的答案)但是,使用 skip-gram 模型你问的几乎是不可能的,因为每个词本身就是一个不同的实体。
skip-gram
您要求的功能开箱即用 FastText 即可完成。它使用 n-grams.
n-gram
Gensim 有高级 API 使用 FastText。