无法在 EMR Spark 集群上使用 Tableau
Can't use Tableau on a EMR Spark cluster
我有一个客户想在他们的 EMR Spark 集群上使用 Tableau。
文档看起来很简单,但我在尝试连接时遇到错误。
设置如下:
- EMR 集群的主节点没有 public IP,但从 Tableau 桌面 EC2 实例我能够 ping
telnet
到端口 10001,其中 thrift
是 运行
- 我可以用
beeline
测试 thrift
并且连接正常
- 考虑到集群具有的访问限制,我没有使用 SSL 或身份验证
- 我已经安装了 data direct 8.0 和 simbaodbc
我正在使用 emr-5.13.0
,Hadoop 发行版是 Amazon 2.8.3,Spark 版本是 2.3.0。
错误是
Unable to connect to the ODBC Data Source. Check that the necessary drivers are installed and that the connection properties are valid.
[Simba][ThriftExtension] (5) Error occurred while contacting server: No more data to read.. This could be because you are trying to establish a non-SSL connection to an SSL-enabled server.
Unable to connect to the server "IP". Check that the server is running and that you have access privileges to the requested database."
我只是按照 Tableau 提供的文档,其中说只安装驱动程序(不要弄乱 ODBC),然后在 Tableau 中使用它。在尝试连接之前,我已经确认我没有设置 SSL 和身份验证。我还通过 运行 Datagrip 进行了验证,并从 Tableau EC2 实例进行了查询,这按预期工作。
通过忽略文档并仅设置 odbc 驱动程序,然后选择它而不是 sparksql 作为源解决了这个问题。
我有一个客户想在他们的 EMR Spark 集群上使用 Tableau。
文档看起来很简单,但我在尝试连接时遇到错误。
设置如下:
- EMR 集群的主节点没有 public IP,但从 Tableau 桌面 EC2 实例我能够 ping
telnet
到端口 10001,其中thrift
是 运行 - 我可以用
beeline
测试thrift
并且连接正常 - 考虑到集群具有的访问限制,我没有使用 SSL 或身份验证
- 我已经安装了 data direct 8.0 和 simbaodbc
我正在使用 emr-5.13.0
,Hadoop 发行版是 Amazon 2.8.3,Spark 版本是 2.3.0。
错误是
Unable to connect to the ODBC Data Source. Check that the necessary drivers are installed and that the connection properties are valid.
[Simba][ThriftExtension] (5) Error occurred while contacting server: No more data to read.. This could be because you are trying to establish a non-SSL connection to an SSL-enabled server.
Unable to connect to the server "IP". Check that the server is running and that you have access privileges to the requested database."
我只是按照 Tableau 提供的文档,其中说只安装驱动程序(不要弄乱 ODBC),然后在 Tableau 中使用它。在尝试连接之前,我已经确认我没有设置 SSL 和身份验证。我还通过 运行 Datagrip 进行了验证,并从 Tableau EC2 实例进行了查询,这按预期工作。
通过忽略文档并仅设置 odbc 驱动程序,然后选择它而不是 sparksql 作为源解决了这个问题。