ElasticSearch:解释所有文档“_size”的总和与 "store.size_in_bytes" API 端点之间的差异?
ElasticSearch: Explaining the discrepancy between sum of all document "_size" and "store.size_in_bytes" API endpoint?
我注意到,如果我将所有 ElasticSearch 文档的 _size
属性 汇总到一个索引中,我得到的值约为 180 GB
,但如果我去相同索引的 _stats
API 端点我得到所有 primaries
的 size_in_bytes
值是 100 GB
.
根据我的理解 _size
属性 应该是 _source
字段的大小并且索引当前存储 _source
字段,所以它不应该在至少与 _size
?
的总和一样大
_size 似乎存储了源文档的实际大小。当实际将源存储在 stored_fields 中时,Elasticsearch 会对其进行压缩(如果我没记错的话,默认为 LZ4)。所以我希望它在磁盘上的大小小于实际大小。如果源中没有任何二进制数据,压缩率也会显着提高。
我注意到,如果我将所有 ElasticSearch 文档的 _size
属性 汇总到一个索引中,我得到的值约为 180 GB
,但如果我去相同索引的 _stats
API 端点我得到所有 primaries
的 size_in_bytes
值是 100 GB
.
根据我的理解 _size
属性 应该是 _source
字段的大小并且索引当前存储 _source
字段,所以它不应该在至少与 _size
?
_size 似乎存储了源文档的实际大小。当实际将源存储在 stored_fields 中时,Elasticsearch 会对其进行压缩(如果我没记错的话,默认为 LZ4)。所以我希望它在磁盘上的大小小于实际大小。如果源中没有任何二进制数据,压缩率也会显着提高。