如果创建一个300个列族的hbase table 可以吗?
If it is ok to create a hbase table with 300 column families?
我有一个场景,其中每个对象都有 300 个变体,所以我想将它们存储在 hbase 中,每一行将原始对象和 300 个变体存储在不同的列族中?访问模型是每天早上尝试将对象批量插入 table,然后读取它们。我不知道是否可以为我创建一个包含 300 个列族的 hbase table场景?
文档 suggests that the number of column families should have a maximum of 10, and also 列族的正常数量在 1 到 3 之间。
您是否反对将三百列存储到一个列族中?
坚持使用非常少的列族:1 或 2
列族映射到底层系统中的文件,从而对 hbase 施加负载。
方法是创建 300 列。
HBase 中的列族数量有限制。每个 Column Family 有一个 MemStore(它是一个写入缓存,用于在将新数据写入 Hfile 之前存储新数据)。当一个满了,他们都冲了。
添加的列族越多,创建的 MemStores 就越多,Memstore 刷新也就越频繁。它会降低性能。
我有一个场景,其中每个对象都有 300 个变体,所以我想将它们存储在 hbase 中,每一行将原始对象和 300 个变体存储在不同的列族中?访问模型是每天早上尝试将对象批量插入 table,然后读取它们。我不知道是否可以为我创建一个包含 300 个列族的 hbase table场景?
文档 suggests that the number of column families should have a maximum of 10, and also 列族的正常数量在 1 到 3 之间。
您是否反对将三百列存储到一个列族中?
坚持使用非常少的列族:1 或 2 列族映射到底层系统中的文件,从而对 hbase 施加负载。 方法是创建 300 列。
HBase 中的列族数量有限制。每个 Column Family 有一个 MemStore(它是一个写入缓存,用于在将新数据写入 Hfile 之前存储新数据)。当一个满了,他们都冲了。
添加的列族越多,创建的 MemStores 就越多,Memstore 刷新也就越频繁。它会降低性能。