snowflake 中每个 table 的 NUMBER_OF_ROWS_RECLUSTERED 如何大于 table 行数

How can the NUMBER_OF_ROWS_RECLUSTERED per table in snowflake be greater than the table number of rows

我刚刚更改了 Snowflake 中 大型 事件 table 的 聚类键 。 当我使用以下查询观察自动重新集群时:

select *
  from table(information_schema.automatic_clustering_history(
    date_range_start=>dateadd(h, -2, current_timestamp)))
    order by start_time desc

...奇怪的事情发生了: NUM_ROWS_RECLUSTERED 比 table 包含的行数高得多。我猜这也会对信用消费产生影响。

如: Table 行数是 13.2 亿,NUM_ROWS_RECLUSTERED 几乎是 24 亿!

为什么会发生这种情况?它不 'feel' 对...

什么是甚至陌生人 是这些数字现在下降 当我输入这个post...

该视图中的数据按小时显示,因此数字肯定会在一小时内发生变化。服务通过多次传递重新聚集数据也很常见,这意味着一些微分区可以重建多次。听起来您的 table 是新的,最近添加了集群密钥,或者更新非常频繁。如果您需要有关正在发生的事情的更多详细信息,我建议您联系特定的 table.

以提供支持