作业完成/退出时的 SLURM 状态字符串
SLURM status string on job completion / exit
如何在作业完成时(在提交脚本中)获取 slurm 作业状态(例如完成、失败、超时等)?
IE。我想写信来单独跟踪超时/失败的作业。
目前我使用退出代码,但是 TIMEOUT 的作业也获得退出代码 0。
为了将来参考,这是我最终的做法。
检索作业开头的 jobid 并将一些信息(例如 "${SLURM_JOB_ID} ${PWD}"
)写入摘要文件。
然后处理这个文件并使用类似sacct -X -n -o State --j ${jid}
的东西来获取作业状态。
如何在作业完成时(在提交脚本中)获取 slurm 作业状态(例如完成、失败、超时等)? IE。我想写信来单独跟踪超时/失败的作业。
目前我使用退出代码,但是 TIMEOUT 的作业也获得退出代码 0。
为了将来参考,这是我最终的做法。
检索作业开头的 jobid 并将一些信息(例如 "${SLURM_JOB_ID} ${PWD}"
)写入摘要文件。
然后处理这个文件并使用类似sacct -X -n -o State --j ${jid}
的东西来获取作业状态。