如何列出 MPI 中每个节点的可用资源?
How to list avaliable resources per node in MPI?
我可以访问 MPI 集群。它是一个纯粹、干净的 lan 集群,除了 OpenMP、mpicc、mpi运行 安装之外,没有 SLURM 或其他东西。我有 sudo 权限。可访问和配置的 MPI 节点都列在 /etc/hosts
中。我可以编译和 运行 MPI 程序,但如何获取有关 MPI 集群能力的信息:可用的总内核数、处理器信息、总内存、当前 运行 宁任务?
可用核心总数:
总内存:
您可以尝试使用 Portable Hardware Locality hwloc 查看硬件拓扑并获取有关总内核和总内存的信息。
此外,您可以使用 lscpu
或 cat /proc/cpuinfo
获取有关 CPU 的信息
当前运行宁任务:
您可以使用 IMB 的监控软件 nmon
(免费)
nmon
的选项 -t
报告顶部 运行ning 进程(如 top
命令)。您可以使用 nmon 联机或脱机模式。
以下例子来自IMB developerWorks
nmon -fT -s 30 -c 120
每 30 秒获取一个 "snapshot",直到它获取 120 个快照。然后你可以检查输出。
如果你 运行 它没有 -f 你会看到实时结果
我可以访问 MPI 集群。它是一个纯粹、干净的 lan 集群,除了 OpenMP、mpicc、mpi运行 安装之外,没有 SLURM 或其他东西。我有 sudo 权限。可访问和配置的 MPI 节点都列在 /etc/hosts
中。我可以编译和 运行 MPI 程序,但如何获取有关 MPI 集群能力的信息:可用的总内核数、处理器信息、总内存、当前 运行 宁任务?
可用核心总数:
总内存:
您可以尝试使用 Portable Hardware Locality hwloc 查看硬件拓扑并获取有关总内核和总内存的信息。
此外,您可以使用 lscpu
或 cat /proc/cpuinfo
当前运行宁任务:
您可以使用 IMB 的监控软件 nmon
(免费)
nmon
的选项 -t
报告顶部 运行ning 进程(如 top
命令)。您可以使用 nmon 联机或脱机模式。
以下例子来自IMB developerWorks
nmon -fT -s 30 -c 120
每 30 秒获取一个 "snapshot",直到它获取 120 个快照。然后你可以检查输出。
如果你 运行 它没有 -f 你会看到实时结果