如果 fetcher.parse 设置为 true,使用 Nutch,Parse 会在 Fetch 完成后执行吗?

Would Parse be executed after Fetch finished if fetcher.parse is set to true, using Nutch?

我想在 Fetch 阶段粗略地解析网页内容,在 Parse 阶段精细地解析网页内容。我应该怎么办?如果 fetcher.parse 设置为 true,Parse 会在 Fetch 完成后执行吗?

无论如何,Parse 阶段都会在 Fetch 阶段之后执行,无论您将 fetcher.parse 设置为 False 还是 True。唯一需要注意的是,设置为 True 时,抓取会更安全,解析问题不会导致抓取内容丢失。

请看这个:

https://issues.apache.org/jira/browse/NUTCH-872