NLTK WordNet 动词层次结构
NLTK WordNet verb hierarchy
我发现 WordNet 的动词层次结构存在一些问题。
例如,
a.lowest_common_hypernyms(wn.synset('love.v.02'))
returns []
.
难道动词也没有像 entity
这样的共同祖先吗?
动词甚至与同一层次结构中的名词相连吗?
要查找任何同义词集的顶部上位词,请使用 Synset.root_hypernyms()
函数,例如:
>>> from nltk.corpus import wordnet as wn
>>> wn.synsets('car')[0].root_hypernyms()
[Synset('entity.n.01')]
>>> wn.synsets('love')[0].root_hypernyms()
[Synset('entity.n.01')]
>>> wn.synsets('love', 'v')[0].root_hypernyms()
[Synset('love.v.01')]
似乎没有overarching/umbrella涵盖所有verbs
的上位词,不像nouns
被entity.n.01
涵盖:
>>> root_hypernyms_of_nouns = Counter(chain(*[ss.root_hypernyms() for ss in wn.all_synsets(pos='n')]))
>>> len(root_hypernyms_of_nouns)
1
>>> root_hypernyms_of_nouns.items()
[(Synset('entity.n.01'), 82115)]
但是您可以尝试遍历所有动词,例如:
wn.all_synsets(pos='v')
并尝试找到动词的最上位词(这将是一个相当大的列表):
>>> from collections import Counter
>>> from itertools import chain
>>> root_hypernyms_of_verbs = Counter(chain(*[ss.root_hypernyms() for ss in wn.all_synsets(pos='v')]))
>>> root_hypernyms_of_verbs.most_common(10)
[(Synset('change.v.01'), 1704), (Synset('change.v.02'), 1295), (Synset('act.v.01'), 1083), (Synset('move.v.02'), 1027), (Synset('make.v.03'), 659), (Synset('travel.v.01'), 526), (Synset('think.v.03'), 451), (Synset('transfer.v.05'), 420), (Synset('move.v.03'), 329), (Synset('connect.v.01'), 262)]
>>> root_hypernyms_of_verbs.keys() # This will return all root_hypernyms.
Visuwords 有一个非常漂亮的交互式图表,您可以使用它手动查看 WordNet 层次结构,http://visuwords.com/entity
我发现 WordNet 的动词层次结构存在一些问题。
例如,
a.lowest_common_hypernyms(wn.synset('love.v.02'))
returns []
.
难道动词也没有像 entity
这样的共同祖先吗?
动词甚至与同一层次结构中的名词相连吗?
要查找任何同义词集的顶部上位词,请使用 Synset.root_hypernyms()
函数,例如:
>>> from nltk.corpus import wordnet as wn
>>> wn.synsets('car')[0].root_hypernyms()
[Synset('entity.n.01')]
>>> wn.synsets('love')[0].root_hypernyms()
[Synset('entity.n.01')]
>>> wn.synsets('love', 'v')[0].root_hypernyms()
[Synset('love.v.01')]
似乎没有overarching/umbrella涵盖所有verbs
的上位词,不像nouns
被entity.n.01
涵盖:
>>> root_hypernyms_of_nouns = Counter(chain(*[ss.root_hypernyms() for ss in wn.all_synsets(pos='n')]))
>>> len(root_hypernyms_of_nouns)
1
>>> root_hypernyms_of_nouns.items()
[(Synset('entity.n.01'), 82115)]
但是您可以尝试遍历所有动词,例如:
wn.all_synsets(pos='v')
并尝试找到动词的最上位词(这将是一个相当大的列表):
>>> from collections import Counter
>>> from itertools import chain
>>> root_hypernyms_of_verbs = Counter(chain(*[ss.root_hypernyms() for ss in wn.all_synsets(pos='v')]))
>>> root_hypernyms_of_verbs.most_common(10)
[(Synset('change.v.01'), 1704), (Synset('change.v.02'), 1295), (Synset('act.v.01'), 1083), (Synset('move.v.02'), 1027), (Synset('make.v.03'), 659), (Synset('travel.v.01'), 526), (Synset('think.v.03'), 451), (Synset('transfer.v.05'), 420), (Synset('move.v.03'), 329), (Synset('connect.v.01'), 262)]
>>> root_hypernyms_of_verbs.keys() # This will return all root_hypernyms.
Visuwords 有一个非常漂亮的交互式图表,您可以使用它手动查看 WordNet 层次结构,http://visuwords.com/entity