使用 Apache SOLR 进行自然语言处理
Natural Language Processing using Apache SOLR
我正在开发一个使用 Apache SOLR 作为索引服务器的应用程序。一项新要求要求我们对已编入索引的产品实施 "Natural Language Processing"。
寻求建议。我应该如何在这里进行。如果有任何 Java Frameworks/Library 可用的 apache solr 来解决这个问题。
您的问题是关于在 solr 中使用 "Natural Language Processing"。
您尚未说明这对您意味着什么。
这可能意味着:检测语言和启发式词干提取
在这种情况下,请查看文档:
- https://cwiki.apache.org/confluence/display/solr/Detecting+Languages+During+Indexing
- https://cwiki.apache.org/confluence/display/solr/Language+Analysis#LanguageAnalysis-Language-SpecificFactories
它可以例如也意味着使用形态学进行词干提取(形态分析/词形还原)。
在这种情况下,有像
这样的开源产品
- http://nlp.stanford.edu/software/(英文,看起来不错)
- https://dev2.dariah.eu/wiki/display/TextGrid/Lemmatizer(对于德语,看起来过时了)
和
等商业产品
我正在开发一个使用 Apache SOLR 作为索引服务器的应用程序。一项新要求要求我们对已编入索引的产品实施 "Natural Language Processing"。 寻求建议。我应该如何在这里进行。如果有任何 Java Frameworks/Library 可用的 apache solr 来解决这个问题。
您的问题是关于在 solr 中使用 "Natural Language Processing"。
您尚未说明这对您意味着什么。
这可能意味着:检测语言和启发式词干提取
在这种情况下,请查看文档:
- https://cwiki.apache.org/confluence/display/solr/Detecting+Languages+During+Indexing
- https://cwiki.apache.org/confluence/display/solr/Language+Analysis#LanguageAnalysis-Language-SpecificFactories
它可以例如也意味着使用形态学进行词干提取(形态分析/词形还原)。 在这种情况下,有像
这样的开源产品- http://nlp.stanford.edu/software/(英文,看起来不错)
- https://dev2.dariah.eu/wiki/display/TextGrid/Lemmatizer(对于德语,看起来过时了)
和
等商业产品