ElasticSearch:解释所有文档“_size”的总和与 "store.size_in_bytes" API 端点之间的差异?

ElasticSearch: Explaining the discrepancy between sum of all document "_size" and "store.size_in_bytes" API endpoint?

我注意到,如果我将所有 ElasticSearch 文档的 _size 属性 汇总到一个索引中,我得到的值约为 180 GB,但如果我去相同索引的 _stats API 端点我得到所有 primariessize_in_bytes 值是 100 GB.

根据我的理解 _size 属性 应该是 _source 字段的大小并且索引当前存储 _source 字段,所以它不应该在至少与 _size?

的总和一样大

_size 似乎存储了源文档的实际大小。当实际将源存储在 stored_fields 中时,Elasticsearch 会对其进行压缩(如果我没记错的话,默认为 LZ4)。所以我希望它在磁盘上的大小小于实际大小。如果源中没有任何二进制数据,压缩率也会显着提高。