Databricks 中的 Z 排序
Z-ordering in Databricks
z 排序优化的重新聚类是 Databricks 中的手动过程还是后台有一个进程 运行 在插入或更新数据后异步重新排序聚类索引?
今天它不是异步或连续过程,而是幂等操作。来自 the docs:
Prior to Databricks Runtime 5.0, Z-Ordering was not an idempotent operation, simply rewriting all data matching the given filter every time the command was run. Starting with Databricks Runtime 5.0, Z-Ordering is idempotent too, just like bin-packing.
您必须对 table 中的新行进行 Z 排序,但您不必为此重写整个 table。
z 排序优化的重新聚类是 Databricks 中的手动过程还是后台有一个进程 运行 在插入或更新数据后异步重新排序聚类索引?
今天它不是异步或连续过程,而是幂等操作。来自 the docs:
Prior to Databricks Runtime 5.0, Z-Ordering was not an idempotent operation, simply rewriting all data matching the given filter every time the command was run. Starting with Databricks Runtime 5.0, Z-Ordering is idempotent too, just like bin-packing.
您必须对 table 中的新行进行 Z 排序,但您不必为此重写整个 table。