Elasticsearch pdf/word 文件插入查询

Elasticsearch pdf/word file insertion query

如何在elastic中插入pdf或word文件作为文档。 elasticsearch会存储文件吗?如果是这样,请指出相关文档和一些相关信息。

您可以使用Mapper Attachments plugin提取和索引PDF和Word文档的文本。我建议在 elasticearch 之外进行文本提取,然后将文本发送到 elasticsearch 进行索引。文本提取是一个棘手的过程,在 elasticsearch 之外,您将有更多的提取机制选择,并且提取库中的错误不会影响 elasticsearch 的稳定性。