首页 > 解决方案 > 数组中所有作业的 seff 作业效率报告

问题描述

我正在寻找工作数组中所有工作的效率报告。seff 命令没有真正的选项。当我为数组作业 ID 运行 seff 命令时,我只获得数组中一项作业的效率报告。

有没有人知道我如何获得阵列中所有作业的效率报告或收集累积统计数据,例如作业阵列中所有作业的内存和 CPU 的平均值、最小值和最大值?

请参阅下面的输出:

[user@cluster]$ seff 26838
Job ID: 26838
Array Job ID: 26835_1
Cluster: cluster
User/Group: user/HPCusers
State: COMPLETED (exit code 0)
Cores: 1
CPU Utilized: 00:05:29
CPU Efficiency: 103.13% of 00:05:19 core-walltime
Job Wall-clock time: 00:05:19
Memory Utilized: 125.11 MB
Memory Efficiency: 8.94% of 1.37 GB

标签: slurm

解决方案


从代码中的注释来看,seff“大致等价”:

sacct -P -n -a --format JobID,User,Group,State,Cluster,AllocCPUS,REQMEM,TotalCPU,Elapsed,MaxRSS,ExitCode,NNodes,NTasks -j <job_id>

但是,与 不同seff的是,它输出作业中每个步骤的信息。我希望它还输出作业数组中每个作业的信息...


推荐阅读