Centos 7 上 HDFS 运行 上的 Tweepy 导入错误

Tweepy import Error on HDFS running on Centos 7

我在 Centos 7 上有一个 Hadoop 集群 运行ning。我正在 运行ning 一个程序(位于 HDFS 上)来提取推文,我需要为此导入 tweepy。我在集群的所有节点上将 pip install tweepy 作为 root 执行,但是当我 运行 程序时仍然出现导入错误。

错误说:ImportError: No module named tweepy

我确定 Tweepy 已安装,因为 pip freeze | grep "tweepy" returns tweepy==3.5.0

我在 /tmp 文件夹中创建了另一个文件 x.py,只有一行 import tweepy,并且 运行 没有错误。仅在 HDFS 上发生错误。

此外,我的默认 python 是 Python 2.7.12,我是使用 Anaconda 安装的。有人可以帮我解决这个问题吗?相同的代码 运行ning 在 Centos 6.6 上的另一个集群 运行ning 上没有任何此类错误。是 OS 问题吗?还是我必须查看集群?

看起来您正在使用 Anaconda 的 Python 来 运行 您的脚本,但是您使用 [=11= 将 tweepy 安装到 CentOS 的 Python 系统安装中].使用 conda 安装 tweepy,或使用 Anaconda 的 pip 可执行文件将 tweepy 安装到您的 Hadoop 集群上。