Hive 到 GCP BigQuery 同步

Hive to GCP BigQuery Sync

我们需要定期 (hourly/daily/any) 将数据从 Hive 表 (Hadoop) 移动到 GCP (Google Cloud Platform) BigQuery。表多,数据量大。您能否告诉我是否可以在这种情况下使用云数据流 (CDF)?还有其他选择吗?

提前致谢!

此致, 库马尔

根据您的时间尺度,有无数种解决方案,但其中任何一个或所有解决方案都涉及使用 gsutil 从 HDFS(到本地文件系统)复制数据,然后到 GCS。或者,您也可以使用 MySQL 备份并在 GCP

上恢复它们​​来开发解决方案