作业完成/退出时的 SLURM 状态字符串

SLURM status string on job completion / exit

如何在作业完成时(在提交脚本中)获取 slurm 作业状态(例如完成、失败、超时等)? IE。我想写信来单独跟踪超时/失败的作业。

目前我使用退出代码,但是 TIMEOUT 的作业也获得退出代码 0。

为了将来参考,这是我最终的做法。

检索作业开头的 jobid 并将一些信息(例如 "${SLURM_JOB_ID} ${PWD}")写入摘要文件。

然后处理这个文件并使用类似sacct -X -n -o State --j ${jid}的东西来获取作业状态。