如何以编程方式从变形形式获取单词的基本形式?

How can get the base form of a word programmatically from the inflected form?

我想在 python

中找到输入词的基本形式

类似于

get_base_form({running, best, eyes, moody})
--> run, good, eye, mood

一个只处理常规表格的解决方案就可以了。但是一个解决不规则问题的答案将是完美的。

如果没有库可以做到这一点,网络服务也可以。

使用 nltk 自然语言工具包中的 SnowballStemmer:

from nltk.stem.snowball import SnowballStemmer

stemmer = SnowballStemmer("english")
print(stemmer.stem("generalized"))
print(stemmer.stem("generalization"))

输出:

general
general

顺便说一下,你可以阅读 nltk 的文档@ https://www.nltk.org/