sPacy 中是否有一个函数来获取给定哈希值的字符串?
Is there a function in sPacy to get the string given hash?
基本上是找spacy.strings.get_string_id()
的对立面,不需要加载语言模型来获取词汇。我尝试了 StringStore
方法,但您需要先添加字符串,否则会出现 "Can't retrieve string for hash 'xxx'" 错误。
用例是散列被序列化,然后在其他地方反序列化。
不,您需要从您用来处理文档的管道中保留一份 StringStore
的副本,以便将来查找字符串的哈希值。
最后,无非是以前见过的字符串列表,要么是标记,要么是注释,你可以简单地重新添加到一个新的StringStore
。
基本上是找spacy.strings.get_string_id()
的对立面,不需要加载语言模型来获取词汇。我尝试了 StringStore
方法,但您需要先添加字符串,否则会出现 "Can't retrieve string for hash 'xxx'" 错误。
用例是散列被序列化,然后在其他地方反序列化。
不,您需要从您用来处理文档的管道中保留一份 StringStore
的副本,以便将来查找字符串的哈希值。
最后,无非是以前见过的字符串列表,要么是标记,要么是注释,你可以简单地重新添加到一个新的StringStore
。