BigQuery Table 设计 - 混合事实和维度 Table?
BigQuery Table Design - Mix Fact and Dimension Tables?
我打算在 BigQuery 中存储多个维度 table。
在规范化的设计中,我会有事实 tables 包含引用一个或多个维度 tables.
的外键
我已经阅读了一些关于非规范化的内容,我想知道我应该走多远。一般而言,人们是否会在 BigQuery 中将事实数据和维度数据混合在一起 table?
关于嵌套字段:
如果单个事实引用多个维度 table,您是否会在每个维度 table 中有一个嵌套列,或者只有一个事实 table 然后使用连接?
In general, do people mix fact and dimension data together into one table in BigQuery?
是的!
In case a single fact refers to multiple dimension tables, would you have a nested column in each of the dimension tables, or just one fact table and then use joins?
您应该将维度数据嵌套在事实数据中,而不是相反。
是的,我经常在 BigQuery 中混合使用事实数据和维度数据。我发现这适用于经常重建的表。
我对向大型 date-partitioned 表添加维度属性更加谨慎。在处理大型 date-partitioned 表时,我开始问这样的问题...如果维度的属性发生变化,我是否重新加载所有日期分区,仅最近 N 天,等等
我打算在 BigQuery 中存储多个维度 table。 在规范化的设计中,我会有事实 tables 包含引用一个或多个维度 tables.
的外键我已经阅读了一些关于非规范化的内容,我想知道我应该走多远。一般而言,人们是否会在 BigQuery 中将事实数据和维度数据混合在一起 table?
关于嵌套字段: 如果单个事实引用多个维度 table,您是否会在每个维度 table 中有一个嵌套列,或者只有一个事实 table 然后使用连接?
In general, do people mix fact and dimension data together into one table in BigQuery?
是的!
In case a single fact refers to multiple dimension tables, would you have a nested column in each of the dimension tables, or just one fact table and then use joins?
您应该将维度数据嵌套在事实数据中,而不是相反。
是的,我经常在 BigQuery 中混合使用事实数据和维度数据。我发现这适用于经常重建的表。
我对向大型 date-partitioned 表添加维度属性更加谨慎。在处理大型 date-partitioned 表时,我开始问这样的问题...如果维度的属性发生变化,我是否重新加载所有日期分区,仅最近 N 天,等等