slurm - 数组中所有作业的 seff 作业效率报告
问题描述
我正在寻找工作数组中所有工作的效率报告。seff 命令没有真正的选项。当我为数组作业 ID 运行 seff 命令时,我只获得数组中一项作业的效率报告。
有没有人知道我如何获得阵列中所有作业的效率报告或收集累积统计数据,例如作业阵列中所有作业的内存和 CPU 的平均值、最小值和最大值?
请参阅下面的输出:
[user@cluster]$ seff 26838
Job ID: 26838
Array Job ID: 26835_1
Cluster: cluster
User/Group: user/HPCusers
State: COMPLETED (exit code 0)
Cores: 1
CPU Utilized: 00:05:29
CPU Efficiency: 103.13% of 00:05:19 core-walltime
Job Wall-clock time: 00:05:19
Memory Utilized: 125.11 MB
Memory Efficiency: 8.94% of 1.37 GB
解决方案
从代码中的注释来看,seff
“大致等价”:
sacct -P -n -a --format JobID,User,Group,State,Cluster,AllocCPUS,REQMEM,TotalCPU,Elapsed,MaxRSS,ExitCode,NNodes,NTasks -j <job_id>
但是,与 不同seff
的是,它输出作业中每个步骤的信息。我希望它还输出作业数组中每个作业的信息...
推荐阅读
- kubernetes - Kubernetes 部署消除了持久卷
- c++ - 不断降低内存分配效率。代码示例
- angular - 如何为购物车应用程序的角度和引导应用程序加载移动和桌面的不同视图
- xml - 在 XPATH 1.0 查询中准确获取下一个兄弟姐妹
- ios - 如何以编程方式使用 UIGraphicsImageRenderer 获取高质量的屏幕截图?
- arrays - Julia - 如何将 DataFrame 转换为数组?
- python - Python html浏览本地url路径问题
- angular - 在 chrome 最新版本 87 中发布视频文件流时出错
- go - 如何在 OpenGL (Go) 中正确创建数组纹理?
- unity3d - 使用 OnCollisionEnter 偶尔会应用两次强制