首页 > 解决方案 > 在 slurm 工作中的时间睡眠

问题描述

我有一个简单的 run.sh 脚本:

#!/bin/bash
python print.py

刚刚在哪里print.py

print("just")
print("print")

我使用命令在集群上提交,我请求一个 CPU 和 1 分钟的挂墙时间:

sbatch -c 1 -t 1 run.sh

一切正常,我在 slurm 日志文件中看到了预期的输出。但是如果我添加time模块没有任何效果:

import time
print("just")
print("print")
time.sleep(10000)

在日志文件中,只看到这条消息,没有任何打印:

slurmstepd: error: *** JOB 378186 ON cn-011 CANCELLED AT 2021-10-05T20:15:28 DUE TO TIME LIMIT *** 

我该如何处理这个问题?我希望我会看到这样的日志文件:

just 
print
slurmstepd: error: *** JOB 378186 ON cn-011 CANCELLED AT 2021-10-05T20:15:28 DUE TO TIME LIMIT ***

标签: pythoncluster-computingslurm

解决方案


推荐阅读