首页 > 解决方案 > SLURM“srun module load”命令退出并出现错误

问题描述

我正在使用带有 Lmod 的 slurm 集群。我有 2 个节点,我想在两个节点上加载一个模块。当我运行命令时

srun -n2 module load python/3.8.10我收到slurmstepd: error: execve(): module: No such file or directory。为什么它不运行module load命令?相反,它正在搜索名称为 的文件module。我怎样才能让它工作?谢谢!

标签: slurm

解决方案


module命令是一个 shell 函数,因此它不像常规命令那样工作,因此No such file or directory. (尝试一下which moduletype module你会明白我的意思)。

在任何情况下,您都不需要srun执行命令,只需在运行代码之前在提交脚本中执行(使用),新环境将传播到分配中的所有节点。modulemodule load python/3.8.10srun


推荐阅读