如何根据内链和外链在 nutch 2.x 中启用页面评分?
How to enable page scoring in nutch 2.x based on inlinks and outlinks?
Nutch 1.x 有这个能力,但是我在 nutch 2.x 中找不到它。 nutch 中是否有任何选项可以启用它,或者我必须自己做?
Nutch 2.x 将 OPIC 作为默认评分机制,如果您没有在配置文件中禁用它,如果您使用的是 hbase,则可以在 s:s 列中看到分数。我建议将 hive 与 hbase 一起用于 SQL 语法。 Mitch 还有另一个评分插件 "scoring.link",它的工作原理类似于 pageRank 算法。您可以在配置文件中进行设置。
Nutch 1.x 有这个能力,但是我在 nutch 2.x 中找不到它。 nutch 中是否有任何选项可以启用它,或者我必须自己做?
Nutch 2.x 将 OPIC 作为默认评分机制,如果您没有在配置文件中禁用它,如果您使用的是 hbase,则可以在 s:s 列中看到分数。我建议将 hive 与 hbase 一起用于 SQL 语法。 Mitch 还有另一个评分插件 "scoring.link",它的工作原理类似于 pageRank 算法。您可以在配置文件中进行设置。