嵌入(word 或其他)标准文件格式
Embeddings (word or other) standard file format
我正在创建自己的词嵌入,并且有各种版本。
将嵌入保存到文件以便其他人以后可以轻松阅读和使用它们的标准方法(如果有的话)是什么?
如果有几种可接受的方法,我将不胜感激解释每种方法的答案。
我发现词嵌入的标准文本格式是什么样的
<vocabulary_length> <embedding_dimensions>
<word1> <emb1_dim1> <emb1_dim2> ...... <emb1_dim_n>
<word2> <emb2_dim1> <emb2_dim2> ...... <emb2_dim_n>
.
.
<word_m> <embm_dim1> <embm_dim2> ...... <embm_dim_n>
在这个例子中 vocabulary_length
是 m
而 embedding_dimensions
是 n
我正在创建自己的词嵌入,并且有各种版本。
将嵌入保存到文件以便其他人以后可以轻松阅读和使用它们的标准方法(如果有的话)是什么?
如果有几种可接受的方法,我将不胜感激解释每种方法的答案。
我发现词嵌入的标准文本格式是什么样的
<vocabulary_length> <embedding_dimensions>
<word1> <emb1_dim1> <emb1_dim2> ...... <emb1_dim_n>
<word2> <emb2_dim1> <emb2_dim2> ...... <emb2_dim_n>
.
.
<word_m> <embm_dim1> <embm_dim2> ...... <embm_dim_n>
在这个例子中 vocabulary_length
是 m
而 embedding_dimensions
是 n