Zeppelin Notebook 没有名为 pandas 和 matplotlib 的模块

Zeppelin Notebook no module named pandas and matplotlib

大家好,

我的问题是关于飞艇笔记本的。我是齐柏林飞艇环境的新手。我有一个 AWS 账户。我正在研究 EMR 集群。我想在 zeppelin 环境中使用 pandas 和 matplotlib。但是,我收到错误 no module named pandas and matplotlib.我找到 this 教程。我来到第 8 步,但我仍然没有遇到同样的问题。 Zeppelin 有翻译。我尝试更改 python 路径,即使我确定路径,我仍然遇到相同的错误。 如果有人遇到这些问题,请帮助我。

%pyspark
import os
import numpy
import pandas
import matplotlib

print("Numpy "+numpy.__version__)
print("Pandas "+pandas.__version__)
print("Matplotlib "+matplotlib.__version__)

Traceback (most recent call last):
File "/tmp/zeppelin_pyspark-444747300595843376.py", line 367, in <module>
raise Exception(traceback.format_exc())
Exception: Traceback (most recent call last):
File "/tmp/zeppelin_pyspark-444747300595843376.py", line 355, in <module>
exec(code, _zcUserQueryNameSpace)
File "<stdin>", line 3, in <module>  
ImportError: No module named pandas

我意识到我正在从我的 EC2 机器中提取路径。我将我的 SSH 输入到我在 AWS 上的主节点。我安装 pandas 和 matplotib。然后 运行 该实例上的“which python”命令。之后,我复制到 pyspark.python 路径。最后,它奏效了。