合并树中的部分是否有最大 "healthy" 大小?

Is there a maximum "healthy" size for a part in a Merge Tree?

我在 Clickhouse 20.7.2 上有一个 table 和 this schema 的 3 节点集群(3 个副本,一个分片)运行ning。我没有更改任何默认的合并树配置设置。

正如预期的那样,Clickhouse 后台合并生成的部分达到了大约 150Gb 的最大大小。它定期生成包含 10-20 个部分的分区。这似乎是意料之中的。

有时我运行 对某些分区进行OPTIMIZE FINAL 以删除重复项。正如预期的那样,这会将各个部分压缩在一起并生成大至 350Gb 的部分。

当 运行安装那么大的零件时,我应该注意什么特别的问题吗? 后台合并生成的默认最大部分大小是否特别为 150Gb 也是有原因的?

非常感谢您。

Is there any specific concern I should watch out for when running parts that are that big?

不用担心。

Also is there a reason for the default max part size generated by background merges to be specifically 150Gb ?

没有特别的原因。 Yandex 事先不知道什么值足够好,他们设置了 100GB。后来(2017 年 12 月),他们决定逐渐将其增加到 300GB(或 500GB?),他们第一次尝试并更改了它,他们设置了 150GB,他们得到了大量的支持,因为所有用户的所有系统都开始合并旧部分和变得很慢。所以他们决定不再更改此参数。