如何列出 MPI 中每个节点的可用资源?

How to list avaliable resources per node in MPI?

我可以访问 MPI 集群。它是一个纯粹、干净的 lan 集群,除了 OpenMP、mpicc、mpi运行 安装之外,没有 SLURM 或其他东西。我有 sudo 权限。可访问和配置的 MPI 节点都列在 /etc/hosts 中。我可以编译和 运行 MPI 程序,但如何获取有关 MPI 集群能力的信息:可用的总内核数、处理器信息、总内存、当前 运行 宁任务?

一般来说,我会搜索可以在 MPI 环境中工作的 sinfo and squeue 模拟?

可用核心总数: 总内存: 您可以尝试使用 Portable Hardware Locality hwloc 查看硬件拓扑并获取有关总内核和总内存的信息。 此外,您可以使用 lscpucat /proc/cpuinfo

获取有关 CPU 的信息

当前运行宁任务: 您可以使用 IMB 的监控软件 nmon(免费) nmon 的选项 -t 报告顶部 运行ning 进程(如 top 命令)。您可以使用 nmon 联机或脱机模式。

以下例子来自IMB developerWorks

nmon -fT -s 30 -c 120

每 30 秒获取一个 "snapshot",直到它获取 120 个快照。然后你可以检查输出。

如果你 运行 它没有 -f 你会看到实时结果