Google DataProc 中的 spark-shell 和 sparkR

spark-shell and sparkR in Google DataProc

我是 Google DataProc 的新手

我们想通过 spark-shell 或 sparkR 运行 一组代码用于测试目的。 是否可以连接到 spark 集群并在 google DataProc 中执行 spark-shell 或 sparkR 中的命令?

我检查了 doc,似乎我们可以使用 spark-submit 提交作业,但我没有找到与 spark-shell 或 SparkR 相关的信息。

是的。

spark-shell 和 sparkR 安装在 dataproc 集群中的所有虚拟机上,您可以通过 SSH 连接到其中任何一个(我通常使用主节点)和 运行 spark-shell 或 sparkR .