首页 > 解决方案 > 使用胖树架构的 HPC 进程数量增加导致速度下降

问题描述

我注意到我一直在具有胖树架构的 HPC 上运行的一个简单程序特别奇怪,我不确定为什么会得到我得到的结果。

我创建的程序只是在不同数量的进程上打印程序的运行时间(使用 MPI)。我通过将进程数从 2 到 256 变化 2^n 来进行实验,虽然每个进程的执行时间随着进程数从 2 个增加到 8 个进程而趋于减少,但这个时间在 64 个进程时急剧增加。

这可能是因为架构本身吗?我想执行时间会随着进程的数量而减少,但这似乎不是超过某个进程阈值的情况。

标签: mpihpc

解决方案


我在阅读文档(去图)后不久就发现了这个问题,并想在此处发布解决方案,以防有人遇到类似问题。在我使用的 HPC(AFRL 的 Mustang)上,我在登录节点上使用 mpirun 执行我的程序。该文档明确指出,需要按照用户指南的第 6 节通过批处理脚本提交作业:

https://www.afrl.hpc.mil/docs/mustangQuickStartGuide.html#jobSubmit


推荐阅读