如何找出哪个应用程序在 hadoop 上消耗最多 space?

How to find out which application consume the most space on hadoop?

我的 hadoop 集群显示它只剩下不到 20% 的磁盘space。我正在使用此命令查看磁盘 space

hdfs dfsadmin -report

但是,我不知道哪个directory/files占用最多space。有办法查出来吗?

使用以下命令。

hdfs dfs -du /

它显​​示给定目录中包含的文件和目录的大小或文件的长度(如果它只是一个文件)。