snowflake 中每个 table 的 NUMBER_OF_ROWS_RECLUSTERED 如何大于 table 行数
How can the NUMBER_OF_ROWS_RECLUSTERED per table in snowflake be greater than the table number of rows
我刚刚更改了 Snowflake 中 大型 事件 table 的 聚类键 。
当我使用以下查询观察自动重新集群时:
select *
from table(information_schema.automatic_clustering_history(
date_range_start=>dateadd(h, -2, current_timestamp)))
order by start_time desc
...奇怪的事情发生了:
NUM_ROWS_RECLUSTERED 比 table 包含的行数高得多。我猜这也会对信用消费产生影响。
如: Table 行数是 13.2 亿,NUM_ROWS_RECLUSTERED 几乎是 24 亿!
为什么会发生这种情况?它不 'feel' 对...
什么是甚至陌生人 是这些数字现在下降 当我输入这个post...
该视图中的数据按小时显示,因此数字肯定会在一小时内发生变化。服务通过多次传递重新聚集数据也很常见,这意味着一些微分区可以重建多次。听起来您的 table 是新的,最近添加了集群密钥,或者更新非常频繁。如果您需要有关正在发生的事情的更多详细信息,我建议您联系特定的 table.
以提供支持
我刚刚更改了 Snowflake 中 大型 事件 table 的 聚类键 。 当我使用以下查询观察自动重新集群时:
select *
from table(information_schema.automatic_clustering_history(
date_range_start=>dateadd(h, -2, current_timestamp)))
order by start_time desc
...奇怪的事情发生了: NUM_ROWS_RECLUSTERED 比 table 包含的行数高得多。我猜这也会对信用消费产生影响。
如: Table 行数是 13.2 亿,NUM_ROWS_RECLUSTERED 几乎是 24 亿!
为什么会发生这种情况?它不 'feel' 对...
什么是甚至陌生人 是这些数字现在下降 当我输入这个post...
该视图中的数据按小时显示,因此数字肯定会在一小时内发生变化。服务通过多次传递重新聚集数据也很常见,这意味着一些微分区可以重建多次。听起来您的 table 是新的,最近添加了集群密钥,或者更新非常频繁。如果您需要有关正在发生的事情的更多详细信息,我建议您联系特定的 table.
以提供支持