如何跨多个数据库查询数据?
How to query data across multi databases?
我有几个 sqlserver
和 mysql
数据库。而且不可能在它们之间连接两个或多个表。
一个想法是在 hadoop
上使用 Hbase
通过存储我需要加入的所有列来实现此目的。因为我不需要临时查询,只需要每天将数据同步到 HDFS。
但考虑到我必须按许多条件过滤行,我不确定 Hbase 是否适合此操作。
有人对此有什么建议吗?
您可以使用sqoop从sqlserver导入数据库,mysql到HDFS,然后使用Hive查询导入的数据。 Hive 支持 SQL,您可以使用 Hive 执行 JOIN。
我认为您不能使用 HBase 进行 JOIN。
我有几个 sqlserver
和 mysql
数据库。而且不可能在它们之间连接两个或多个表。
一个想法是在 hadoop
上使用 Hbase
通过存储我需要加入的所有列来实现此目的。因为我不需要临时查询,只需要每天将数据同步到 HDFS。
但考虑到我必须按许多条件过滤行,我不确定 Hbase 是否适合此操作。
有人对此有什么建议吗?
您可以使用sqoop从sqlserver导入数据库,mysql到HDFS,然后使用Hive查询导入的数据。 Hive 支持 SQL,您可以使用 Hive 执行 JOIN。
我认为您不能使用 HBase 进行 JOIN。