如何将 xml/pdf/csv 中的值提取到 splunk 或 solr?

How do ingesting value from xml/pdf/csv to splunk or solr?

我想通过使用 splunk 或 solr 从 xml 或 csv 或 pdf 文件中获取值。如何将这些格式文件导入到 splunk 和 solr 中?

我尝试将 xml 文件导入 solr,但它不适合 solr 模式。 此外,我不知道将文件导入splunk。

要将 CSV 或 XML 文件添加到 Splunk,您可以使用“设置”>“添加数据”,然后上传您感兴趣的文件。

您可以在使用 xmlkvspath 命令摄取后处理 XML。这将从数据中提取字段,使其更易于使用。您也可以在 props.conf 中设置 kv_mode=xml,如 props.conf.

的文档中所述

要阅读 PDF,您需要一些其他工具将其转换为可读格式,例如 pdf2text