Bigquery table 数据性能

Biquery table data performance

BigQuery 中,我有一个 table 存储 237 GB 数据。我没有任何可以在其上创建分区的列,因为它不存储任何日期字段 当我在查询中使用它时,处理表示将处理 77 GB 数据,但以字节为单位,我看到 7 GB 数据。 这里处理的实际数据量是多少? 有什么办法可以重组这个 table 吗?

BigQuery 运行 column-wise。如果您只选择查询中真正需要的列,那么您就已经在优化成本了。传统上数据库操作 row-wise,所以这可能有点 counter-intuitive.

还有这么棒的blog article on optimizing for costs