首页 > 解决方案 > gRPC+MPI 是否需要 RDMA?

问题描述

在指定通信协议时,Tensorflow 允许选项“gRPC”、“gRPC+verbs”和“gRPC+mpi”。在 gRPC+verbs文档中,明确指出该协议是基于 RDMA 的。同时,在 gRPC+MPI文档中,它根本没有暗示这一点,最初我假设 gRPC+mpi 可以在任何底层网络上运行。然而,这篇研究论文暗示 gRPC+mpi 需要在 RDMA 上运行(见第 3 页末尾)。我误解了研究论文吗?gRPC+MPI 实际上可以在任何网络上运行吗?

标签: tensorflowmpigrpcinfinibandrdma

解决方案


我找到了答案,同一篇研究论文的第 4 页表明 MPI 通道只是能够支持 RDMA。


推荐阅读