推特API使用Nifi+Kafka有什么优势?
What are the advantages of using Nifi + Kafka with the Twitter API?
我一直在寻找使用 Spark 在流式传输中进行情绪分析的架构,我遇到了这个架构。
我想知道,在 Twitter 上使用 Nifi + Kafka 有什么好处 API 而不是直接将 Spark 连接到它,我认为它会像这样更容错,但我真的只是不不知道。
NiFi 是一种数据集成工具 - 它移动数据。它非常适合从源(例如 Twitter)获取数据并将其写入目的地(例如 Kafka)。
总的来说,NiFi 擅长从一个源持续拉和推到一个目的地(但你也可以推送到 NiFi,并通过在流程中创建端点从 NiFi 中拉取。
在您的情况下,您正在从 Twitter 拉取 - 您将如何拉取它,然后如何将这些数据传送到 Spark?一般来说,Spark 想要pull from a source.
NiFi 有很多用于与数据源集成的内置功能,包括从 Twitter 中提取数据。通过使用 NiFi,您不必自己编写该功能。
NiFi 没有众所周知的协议来推送数据 to/pull 数据,因为这不是 NiFi 的目的。您可以在 NiFi 中自己构建该功能,例如通过在您的 NiFi 流中创建 HTTP 端点,或通过使用 NiFi 的站点到站点协议,但您现在要走的是不太受欢迎的路径并为你自己。
但是,Kafka 有一个众所周知的协议,Spark 与 Kafka 作为流媒体源有很好的集成。您可以通过很少的自定义工作轻松地将两者连接起来。
NiFi 还与作为数据目的地的 Kafka 集成得很好。
因此,开箱即用的 NiFi 可以处理 Twitter -> Kafka,而 Spark 可以开箱即用地处理来自 Kafka 的 consuing。您不必编写太多(如果有的话)自定义代码来处理获取您的 Twitter 数据。
当然,Kafka 还为这个用例添加了所有众所周知的好处,其中许多在 NiFi 中不存在(因为 NiFi 不是消息代理,也没有尝试提供相同的功能).
我一直在寻找使用 Spark 在流式传输中进行情绪分析的架构,我遇到了这个架构。
我想知道,在 Twitter 上使用 Nifi + Kafka 有什么好处 API 而不是直接将 Spark 连接到它,我认为它会像这样更容错,但我真的只是不不知道。
NiFi 是一种数据集成工具 - 它移动数据。它非常适合从源(例如 Twitter)获取数据并将其写入目的地(例如 Kafka)。
总的来说,NiFi 擅长从一个源持续拉和推到一个目的地(但你也可以推送到 NiFi,并通过在流程中创建端点从 NiFi 中拉取。
在您的情况下,您正在从 Twitter 拉取 - 您将如何拉取它,然后如何将这些数据传送到 Spark?一般来说,Spark 想要pull from a source.
NiFi 有很多用于与数据源集成的内置功能,包括从 Twitter 中提取数据。通过使用 NiFi,您不必自己编写该功能。
NiFi 没有众所周知的协议来推送数据 to/pull 数据,因为这不是 NiFi 的目的。您可以在 NiFi 中自己构建该功能,例如通过在您的 NiFi 流中创建 HTTP 端点,或通过使用 NiFi 的站点到站点协议,但您现在要走的是不太受欢迎的路径并为你自己。
但是,Kafka 有一个众所周知的协议,Spark 与 Kafka 作为流媒体源有很好的集成。您可以通过很少的自定义工作轻松地将两者连接起来。
NiFi 还与作为数据目的地的 Kafka 集成得很好。
因此,开箱即用的 NiFi 可以处理 Twitter -> Kafka,而 Spark 可以开箱即用地处理来自 Kafka 的 consuing。您不必编写太多(如果有的话)自定义代码来处理获取您的 Twitter 数据。
当然,Kafka 还为这个用例添加了所有众所周知的好处,其中许多在 NiFi 中不存在(因为 NiFi 不是消息代理,也没有尝试提供相同的功能).