tensorflow - gRPC+MPI 是否需要 RDMA?
问题描述
在指定通信协议时,Tensorflow 允许选项“gRPC”、“gRPC+verbs”和“gRPC+mpi”。在 gRPC+verbs文档中,明确指出该协议是基于 RDMA 的。同时,在 gRPC+MPI文档中,它根本没有暗示这一点,最初我假设 gRPC+mpi 可以在任何底层网络上运行。然而,这篇研究论文暗示 gRPC+mpi 需要在 RDMA 上运行(见第 3 页末尾)。我误解了研究论文吗?gRPC+MPI 实际上可以在任何网络上运行吗?
解决方案
我找到了答案,同一篇研究论文的第 4 页表明 MPI 通道只是能够支持 RDMA。
推荐阅读
- javascript - 云功能中的firebase分布式计数器扩展
- java - 如何在java中读取嵌套的json列表?
- javascript - Firestore:react Native 中无限滚动的 geohash 查询中的 startAt
- firebase - 跨不同时区的时间段的 Firebase 预订
- c# - 循环数组以查找重复项
- migration - 将 log4j.properties 文件从 Log4j 版本 1 迁移到 2 的合适指南
- ruby-on-rails - 在 RSpec 中测试实例方法时,我的空数组参数没有被读取
- node.js - 更新未验证 Mongoose 连接
- python - sublime text3 不显示 utf8 字符,而是显示它们的代码
- apache-spark - 如何使用 PySpark RDD api 找到哪个句子的单词数最多?