读取文件/文档的 Logstash

Logstash in reading files/ documents

我想知道是否有任何方法可以让 logstash 配置文件读取不同的文档,即 docx、pdf、excel,并将它们存储到 elasticsearch 中。

非常感谢。

Logstash 无法读取 .docx、.xls 或 .pdf 文件,因为这类文件不是文本文件,它们是二进制 glob,只有在被旨在解析它们的应用程序解释后才显得简单。

Logstash 旨在处理纯文本文件,确定文件是否可以被 Logstash 轻松读取的一个很好的测试是您是否可以在 text[=17] 中打开文件=] sublime、notepad 或 atom 等编辑器并读取内容,Logstash 也可以。

尝试在记事本中打开一个 .docx 文件,这应该会清楚。