使用 Tableau 创建仪表板的 Hive 性能?

Hive performance to create Dashboard using Tableau?

我们计划在 Azure 云中实施一个项目,其中数据存储目前将是 Azure 数据湖,将来将实施 HDP,ADLS 将是扩展的数据节点。我们希望从 ADLS 公开数据以使用 Tableau 创建仪表板。最初的计划是使用 Hive,Tableau 将通过 Hive 连接到数据。但是这里出现了性能问题:

  1. 将有多个用户可以通过 Tableau 访问数据(100+)

  2. 我们还必须通过 API 调用将数据公开到不同的门户。

这意味着将同时建立多个连接,这将命中 hive 。我的问题是:

  1. hive能用最少的时间达到目​​的吗?

  2. 如何衡量效果?

  3. 我不想让我的用户在 运行 tableau 查询后坐等很长时间才能看到仪表板。

能否分享一下您在这个设计问题上的经验?我们应该使用 Hive 还是应该使用其他一些具有更好性能的工具来处理 tableau 和 HDFS 存储。有人建议我使用 Azure SQL Server 并将 Tableau 连接到 SQL 服务器。但这又是旧时尚,也是成本问题,因为价格与每个查询的执行有关。

如有更好的解决经验请分享,不胜感激

提前致谢。

Hive LLAP 可以工作,如果你能安装的话。

否则,在我的工作中,我们在 S3 数据上使用 PrestoDB 和 Tableau 有很好的经验。

一些团队使用 Spark SQL,您可以设置一个 Spark Thrift 服务器,它应该与 Hive JDBC/ODBC 驱动程序兼容