配置单元上非分区 table 的优点?

Advantages of non-partitioned table on hive?

Hive 上未分区的 table 有什么优势吗——与分区的 table 相比,它们的特殊用例?

如果有人能提供帮助就太好了。 :)

这么说吧:在数据库的世界里,分区可以用来解决各种各样的问题。只要你没有明确的问题,就不要为分区 (即 "if it ain't broken, don't fix it") 而烦恼。每当遇到问题时,请 DB 架构师找到解决方案 - 可能涉及分区,也可能不涉及。

但是 Hive 不是典型的数据库。分区无处不在,只是因为它是缺少索引的粗略解决方法...

(好吧,实际上 ORC 格式有自己的解决方法[每个条带的每列存储 min/max 值,这允许跳过无用的条带]因此分区对于该格式不太重要)