读取文件/文档的 Logstash
Logstash in reading files/ documents
我想知道是否有任何方法可以让 logstash 配置文件读取不同的文档,即 docx、pdf、excel,并将它们存储到 elasticsearch 中。
非常感谢。
Logstash 无法读取 .docx、.xls 或 .pdf 文件,因为这类文件不是文本文件,它们是二进制 glob,只有在被旨在解析它们的应用程序解释后才显得简单。
Logstash 旨在处理纯文本文件,确定文件是否可以被 Logstash 轻松读取的一个很好的测试是您是否可以在 text[=17] 中打开文件=] sublime、notepad 或 atom 等编辑器并读取内容,Logstash 也可以。
尝试在记事本中打开一个 .docx 文件,这应该会清楚。
我想知道是否有任何方法可以让 logstash 配置文件读取不同的文档,即 docx、pdf、excel,并将它们存储到 elasticsearch 中。
非常感谢。
Logstash 无法读取 .docx、.xls 或 .pdf 文件,因为这类文件不是文本文件,它们是二进制 glob,只有在被旨在解析它们的应用程序解释后才显得简单。
Logstash 旨在处理纯文本文件,确定文件是否可以被 Logstash 轻松读取的一个很好的测试是您是否可以在 text[=17] 中打开文件=] sublime、notepad 或 atom 等编辑器并读取内容,Logstash 也可以。
尝试在记事本中打开一个 .docx 文件,这应该会清楚。