spark 数据框和设计 Hbase:一个 table 多列与多个 table 一个列族

spark dataframe and design Hbase : one table multiple-columns vs multiple tables one column family

我在 Oracle 数据库上有多个 table。我想在 Hbase 上复制这个 tables,最好的设计是什么,一个 table 具有多个列族并且每个列族代表一个 oracle table?或 Hbase 上的多个 tables,一个列族包含所有字段或多个 tables 与多个列族(每个列族包含一个列限定符)?

之后我会使用 spark dataframe 运行 一些工作并像 Oracle 一样查询!

您使用哪种策略?

亲切

不鼓励一个 table 的多个列族(超过 3 个列族)。

请参阅hbase manual

所以您还有其他选择[s],您提到的更适合您的要求和设计类型。