linux - 更改 RUNNING Slurm 作业的 CPU 计数
问题描述
我有一个 SLURM 集群和一个 RUNNING 作业,我在其中请求了 60 个线程
#SBATCH --cpus-per-task=60
(我正在使用 cgroups 在节点上共享线程)
我现在想将线程数减少到 30。
$ scontrol update jobid=274332 NumCPUs=30
Job is no longer pending execution for job 274332
该作业仍然分配了 60 个线程。
$ scontrol show job 274332
JobState=RUNNING Reason=None Dependency=(null)
NumNodes=1 NumCPUs=60 NumTasks=1 CPUs/Task=60 ReqB:S:C:T=0:0:*:*
如何正确地做到这一点?
谢谢!
解决方案
在当前版本的 Slurm 中,scontrol
只允许减少分配给正在运行的作业的节点数量,但不能减少 CPU(或内存)的数量。
常见问题解答说:
使用 scontrol 命令更改作业的大小,方法是为作业指定新的节点计数 (NumNodes=),或标识您希望作业保留的特定节点 (NodeList=) 。
(强调我的)
推荐阅读
- vbscript - Sap Logon automate login using vsbcript
- laravel - Access Method in a hasManyThorugh
- html - 使用 :not(selector) 选择除少数之外的所有元素
- python - 使用 Python 解析北欧格式(首先是 DMY,然后是 YMD)日期的最佳方法
- ruby - ModBus TCP communication using Ruby: failing to implement HelloWorld
- sql - Sqllite PEG parser to support BigQuery SQL syntax
- openlayers - Color lookup table / Color manipulation / Color correction
- jquery - 无法使用 jQuery 序列化的 PHP post 变量检索
- git - 致命:无法读取 Visual Studio 的用户名
: 没有这样的设备或地址 - html - Disable events on element to be handled by underlying element