bioinformatics - Snakemake 工作流程卡住 - 等待在 SLURM 集群上执行的作业
问题描述
我在执行 Snakemake 工作流程时遇到问题,希望您能帮助我。
如果我在本地机器上运行管道,一切都很好。但是,有时(并非总是)当我指定在 SLURM 计算集群上执行规则时,工作流可能会“卡住”。请查看下面的附图 - 该过程表示它会等到所有作业完成,以便它可以继续执行下游步骤。但是,当我检查我的squeue
所有工作确实完成并且输出文件已经存在时(!)只是主进程“没有收到通知”......在这种情况下我必须手动杀死它,解锁snakemake 目录并重新运行管道。
我使用 Snakemake 5.19.0
;我的执行命令:
snakemake \
--snakefile="../Snakefile" \
--configfile="../configs/config.yml" \
--cluster-config "../configs/cluster_config.json" \
--use-singularity \
--cores 128 \
--local-cores 2 \
--printshellcmds \
--verbose \
--latency-wait 120 \
--cluster \
"sbatch \
--cpus-per-task={cluster.threads} \
--mem={cluster.mem} \
--qos={cluster.queue} \
--time={cluster.time} \
--output={params.LOG_cluster_log}-%j-%N.log \
-p XXX" \
--singularity-args "--no-home --bind ${PWD}/.."
解决方案
推荐阅读
- javascript - 为什么我不能使用 nodemailer 和 nodejs 发送电子邮件?
- javascript - 你如何在每个堆积柱形图(谷歌图表)上编码一个总计?
- python - 如何使用 matplotlib 在 pytorch 上显示损失和准确度图
- sql - 如何访问 sqlite 模型中的外键字段?
- php - 将所有列加起来
- java - 如何在 Intellij Idea 的代码块中关闭参数名称提示?
- python - 更改 1 列,其余部分保持不变
- bash - 使用 SCP 的语法是否发生了变化?在较新的服务器上出现意外的文件名错误
- c++ - 下面的代码输出 1 和 0 但是我不知道为什么
- javascript - 在 React 中显示图像文件夹