snowflake 中每个 table 的 NUMBER_OF_ROWS_RECLUSTERED 如何大于 table 行数

Question

我刚刚更改了 Snowflake 中大型事件 table 的 聚类键 。当我使用以下查询观察自动重新集群时：

select *
  from table(information_schema.automatic_clustering_history(
    date_range_start=>dateadd(h, -2, current_timestamp)))
    order by start_time desc

...奇怪的事情发生了： NUM_ROWS_RECLUSTERED 比 table 包含的行数高得多。我猜这也会对信用消费产生影响。

如： Table 行数是 13.2 亿，NUM_ROWS_RECLUSTERED 几乎是 24 亿！

为什么会发生这种情况？它不 'feel' 对...

什么是甚至陌生人 是这些数字现在下降 当我输入这个post...

Answer 1

该视图中的数据按小时显示，因此数字肯定会在一小时内发生变化。服务通过多次传递重新聚集数据也很常见，这意味着一些微分区可以重建多次。听起来您的 table 是新的，最近添加了集群密钥，或者更新非常频繁。如果您需要有关正在发生的事情的更多详细信息，我建议您联系特定的 table.

以提供支持

snowflake 中每个 table 的 NUMBER_OF_ROWS_RECLUSTERED 如何大于 table 行数

How can the NUMBER_OF_ROWS_RECLUSTERED per table in snowflake be greater than the table number of rows

snowflake-cloud-data-platform