impala - 它需要 hdfs 和名称节点吗?

impala - does it require hdfs and namenodes?

EC2(非 EMR)上的 Apache Impala install/run 可以从 S3 读取数据吗?还是需要 Hadoop Namenodes 和 HDFS 才能工作? 文档对安装依赖不是很清楚。

是的,Impala 可以 运行 没有 hdfs。它从 hadoop 生态系统中需要的唯一组件是 hive-metastore,它用于存储元数据。

关于S3的可访问性,可以参考https://www.cloudera.com/documentation/enterprise/5-7-x/topics/impala_s3.html