ExtractGrok 如何使用多个正则表达式？

Question

我有一个 Kakfa 主题，其中包含从不同来源发送的不同类型的消息。

我想使用 ExtractGrok 处理器根据常规 expression/grok 模式提取消息。

如何配置或运行具有多个正则表达式的处理器？

例如，Kafka 主题包含来自不同应用程序的 INFO、WARNING 和 ERROR 日志条目。

我想将不同日志级别的消息分开，然后放入 HDFS。

Answer 1

不要使用 ExtractGrok 处理器，而是使用 NiFi 中的 分区记录处理器 来分区为这个处理器

然后使用PutHDFS处理器根据loglevel属性存储流文件。

流量：

1.ConsumeKafka processor
2.Partition Record
3.PutHDFS processor

参考this link描述了配置PartitionRecord处理器的所有步骤。

参考this link描述了如何使用PutHDFS处理器在HDFS目录中动态存储分区。

How Can ExtractGrok use multiple regular expressions?