首页 > 解决方案 > 有没有使用多节点多GPU进行分布式TensorFlow训练的例子?

问题描述

通过谷歌搜索,我可以找到以下两种关于tensorflow训练的部署:

有没有使用多节点多GPU的例子?具体来说,存在两个级别的并行性:

  1. 第一层,参数服务器和worker分布在不同的节点上;
  2. 第二层,单台机器上的每个worker将使用多个GPU进行训练;

标签: tensorflowdeep-learning

解决方案


GitHub 上的 Tensorflow Inception 模型文档(链接)对不同类型的训练有很好的解释,请务必查看它及其源代码。

此外,您可以查看这段代码,它也确实以稍微不同的方式分发培训。


推荐阅读