如何通过 Presto 访问 Google 存储中的数据?

How can I access Data in Google Storage via Presto?

我对数据湖有要求,根据用例应用程序使用不同类型的存储。我有 MySQL、Hive、Google 云存储。我使用 Presto 作为查询引擎。我想让它成为人们可以访问任何类型的数据存储的数据的一站式解决方案吗?我已配置 MySQL 连接器和 Hive 连接器运行良好。我尝试使用 TPCH 连接器连接 Google 云存储。

这是正确的做法吗?我的方向正确吗?

不,TPCH 连接器 (https://docs.starburstdata.com/latest/connector/tpch.html) 并不意味着连接到任何真实的存储引擎。相反,它会在运行时为 TPC-H 基准测试所需的表生成数据。它的主要用途是测试 ANSI SQL 语法。

Google 据我所知,Presto 的云存储连接器不存在。 您可以考虑构建一个并回馈开源。 或者随时联系 Starburst Data (www.starburstdata.com)

您可以尝试设置一个Minio Server and use Hive Connector(S3)

我认为这里的答案已经过时,因为 link 显示 GCS 连接器现在可用:https://docs.starburst.io/latest/connector/hive-gcs-tutorial.html