mpi - 使用胖树架构的 HPC 进程数量增加导致速度下降
问题描述
我注意到我一直在具有胖树架构的 HPC 上运行的一个简单程序特别奇怪,我不确定为什么会得到我得到的结果。
我创建的程序只是在不同数量的进程上打印程序的运行时间(使用 MPI)。我通过将进程数从 2 到 256 变化 2^n 来进行实验,虽然每个进程的执行时间随着进程数从 2 个增加到 8 个进程而趋于减少,但这个时间在 64 个进程时急剧增加。
这可能是因为架构本身吗?我想执行时间会随着进程的数量而减少,但这似乎不是超过某个进程阈值的情况。
解决方案
我在阅读文档(去图)后不久就发现了这个问题,并想在此处发布解决方案,以防有人遇到类似问题。在我使用的 HPC(AFRL 的 Mustang)上,我在登录节点上使用 mpirun 执行我的程序。该文档明确指出,需要按照用户指南的第 6 节通过批处理脚本提交作业:
https://www.afrl.hpc.mil/docs/mustangQuickStartGuide.html#jobSubmit
推荐阅读
- django - 在 django 2.2 中。select_related 字段不起作用?如何修复它
- java - 在java中收集数据框列名
- javascript - 使用office js displayDialogAsync函数在桌面Excel上禁用背景
- python - 是否可以将 python 多处理与 MS SQL Server 一起使用
- r - 计算连续的数字
- python - 为什么预言家预测(尤其是年度季节性)与情节组件中的年度季节性完全不同?
- javascript - pubnub心跳间隔对内存有影响吗?
- hive - 如何在 hive 的 select 语句中编写子查询
- powershell - 用于将属性从文件中间移动到文件末尾的 Powershell 脚本
- extjs - ExtJS 7 - 锁定列的列过滤器问题