使用 Apache Solr 索引 Nutch 数据

Using Apache Solr to index Nutch data

我正在尝试设置 Solr 来索引我的 Nutch 爬虫的结果。我在网上找到的教程要求将文件 conf/schema.xml 作为配置的一部分从 Nutch 复制到 Solr,但是我的 Nutch 版本中不存在该文件。还有另一种方法可以做到这一点还是我缺少什么? 干杯

查看 "official" Nutch tutorial:

Note: due to NUTCH-2745 the schema.xml is not contained in the binary package. Please download the schema.xml from the source repository.

NUTCH-2745 仅适用于 Nutch 1.16 版本,将在 1.17 中修复。