GCP dataproc 是否包含 webhcat?

Does GCP dataproc include webhcat?

我想知道 GCP 的 DataProc 是否支持 WebHCat. Googling 还没有找到任何东西。

那么,GCP DataProc support/provide WebHCat 是什么?如果是,URL 端点是什么?

Dataproc 不提供开箱即用的 WebHCat,但是,创建 initialization action 例如:

很简单
#!/bin/bash
apt-get install hive-webhcat-server

WebHCat 将在端口 50111 上可用:

http://my-cluster-m:50111/templeton/v1/ddl/database/default/table/my-table

或者,可以设置到 HiveServer2 的 JDBC 连接(默认可用): https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients#HiveServer2Clients-JDBC

截至目前,您可以在集群创建期间使用 Dataproc Hive WebHCat component 激活 Hive WebHCat:

gcloud dataproc clusters create $CLUSTER_NAME --optional-components=HIVE_WEBHCAT