python - 如何预测 MPI 进程被杀死
问题描述
寻找有关以下问题的一些建议。
我在 SLURM 系统上使用 mpi4py 运行了许多作业。我注意到,当给定的工作太大(即要处理的数据太多)时,我会收到以下错误:
mpirun noticed that process rank 0 with PID 62208 on node node1 exited on signal 9 (Killed).
我曾尝试在提交之前将一些作业分解为更小的块,但我想知道是否有一种方法可以预测 Killed 信号并添加一个 except 语句以在需要时将作业分解为块。
解决方案
KILL 信号不能被捕获、阻止或忽略,但它通常前面有一个 INT 或 TERM 信号,您可以捕获并借此机会采取行动。在这里查看INT 信号的 Python 示例
推荐阅读
- lua - 需要帮助使用罗技 G910 相对移动鼠标光标
- html - html css中是否存在非空格分隔符?
- python - 如何制作透明的绘图点
- javascript - 将 onClick 添加到 React 表单中的提交按钮
- python - 为什么我的 docker 容器没有控制台输出?
- python - AllenNlp QA 应用程序为文档中的每个单词生成 Spacy 警告:[WARNING] [W108]
- xdp-bpf - XDP:缺少 TCP 数据?
- javascript - 无法在 owt-server 上使用 owt-client-javascript 发布本地流
- c - 我怎样才能正确地将 void* 转换为 int?
- python - 我想从用户那里收到一个列表并在其中执行一些步骤并在步骤后将其打印回来但它没有按我想要的方式工作