slurm - 理解 sacct 的 maxRSS——为什么一个工作有两行?
问题描述
我有来自的输出sacct --format="jobID,CPUTime,MaxRSS" -j 66930332_195
。我知道 maxRSS 报告的值大致相当于最大内存使用量。但是,maxRSS 中的两个不同的行指的是什么?
JobID CPUTime MaxRSS
------------ ---------- ----------
66930332_195 00:05:15
66930332_19+ 00:05:15 4688356K
66930332_19+ 00:05:15 2376K
提前致谢!我无法在任何地方找到此文档
解决方案
如果您使用%20
这样的方式完整显示 JobID,
sacct --format="jobID%20,CPUTime,MaxRSS"
你可能会看到这样的东西:
JobID CPUTime MaxRSS
------------ ---------- ----------
66930332_195 00:05:15
66930332_195.0 00:05:15 4688356K
66930332_195.1 00:05:15 2376K
第一行对应于作业本身,其他行对应于作业步骤。这应该与srun
您在提交脚本中执行的调用次数相对应。