在 NiFi 中使用 GetHTMLElement 重定向 URL

Redirecting URL using GetHTMLElement in NiFi

我在 NiFi 中使用 GetHTTP 和 GetHTMLElement 处理器从 HTML 页面获取了下一个 url。我如何在另一个 GetHTMLElement 处理器中使用这个获取的 URL,因为它不采用或考虑其先前处理器的属性。

NiFi:NiFi1.1.1

版本

任何答案尽早会有帮助。

谢谢

您可以将 URL 发送到支持传入流文件的 InvokeHttp 处理器,您可以将 "Remote URL" 设置为表达式语言,如“${HTMLElement}”或任何属性名称所在的位置url 是。

根据 Bryan Bende 的建议,

我通过在 GetHTMLElement 中设置基础 URL 并将属性名称设置为 abs:href 来提取下一个 url 并将其发送到 InvokeHTTP processor.Then 我环回输出InvokeHTTP 到前一个 GetHTMLElement 以进一步提取下一个 URLs.

在 GetHTMLElement 中将属性名称设置为 abs:href 有助于形成正确的 URL.In 我的情况它有助于形成完整的 URL 为:

www.abc.com/extracted_next_url

我的基地 URL 是:

www.abc.com

谢谢