以文本格式保存word2vec
saving word2vec in text format
我试图将word2vec向量保存为文本,但没有成功,我得到一个错误,我不太明白,这里出现了什么重复项,这是什么"wv",建议。也许有人可以向我解释。提前谢谢你
model = Word2Vec(all_words, min_count=3, sg = 1, size = 300 )
model.save_word2vec_format('test_w2v.txt', binary=False)
WARNING:gensim.models.base_any2vec:under 10 jobs per worker: consider setting a smaller `batch_words' for smoother alpha decay
Word2Vec(vocab=20, size=300, alpha=0.025)
Traceback (most recent call last):
File "/word2vec.py", line 26, in <module>
model.save_word2vec_format('test_w2v.txt', binary=False)
File "/word2vec.py", line 1307, in save_word2vec_format
raise DeprecationWarning("Deprecated. Use model.wv.save_word2vec_format instead.")
DeprecationWarning: Deprecated. Use model.wv.save_word2vec_format instead.
因为.save_word2vec_format()
只保存向量——不是完整的模型——它应该只用于模型的子属性 .wv
。 (这是一个只包含向量的对象。)
因此,如果您 运行 model.wv.save_word2vec_format('test_w2v.txt', binary=False)
,按照错误消息的建议,您将以文本格式保存矢量。
(如果您需要保存完整模型,请使用 model.save()
- 它会保存更多信息,并可能使用多个附加文件,但它会在 Python- 和 gensim-特定格式,不同于其他工具可以读取的纯文本格式。)
我试图将word2vec向量保存为文本,但没有成功,我得到一个错误,我不太明白,这里出现了什么重复项,这是什么"wv",建议。也许有人可以向我解释。提前谢谢你
model = Word2Vec(all_words, min_count=3, sg = 1, size = 300 )
model.save_word2vec_format('test_w2v.txt', binary=False)
WARNING:gensim.models.base_any2vec:under 10 jobs per worker: consider setting a smaller `batch_words' for smoother alpha decay
Word2Vec(vocab=20, size=300, alpha=0.025)
Traceback (most recent call last):
File "/word2vec.py", line 26, in <module>
model.save_word2vec_format('test_w2v.txt', binary=False)
File "/word2vec.py", line 1307, in save_word2vec_format
raise DeprecationWarning("Deprecated. Use model.wv.save_word2vec_format instead.")
DeprecationWarning: Deprecated. Use model.wv.save_word2vec_format instead.
因为.save_word2vec_format()
只保存向量——不是完整的模型——它应该只用于模型的子属性 .wv
。 (这是一个只包含向量的对象。)
因此,如果您 运行 model.wv.save_word2vec_format('test_w2v.txt', binary=False)
,按照错误消息的建议,您将以文本格式保存矢量。
(如果您需要保存完整模型,请使用 model.save()
- 它会保存更多信息,并可能使用多个附加文件,但它会在 Python- 和 gensim-特定格式,不同于其他工具可以读取的纯文本格式。)