首页 > 解决方案 > 如何在 TF 2.0 / 1.14.0-eager 和自定义训练循环(梯度磁带)中执行梯度累积?

问题描述

背景:我有一个模型,我正在尝试移植它以TF 2.0获得一些甜蜜的渴望执行,但我似乎无法弄清楚如何进行分布式训练(4 个 GPU)并同时执行梯度累积。

问题:

我已经阅读了分布式训练循环指南并设法实现它: https ://www.tensorflow.org/beta/tutorials/distribute/training_loops

我还在 TF 2.0 中为自定义训练循环实现了梯度累积,并且tf.kerashttps ://colab.research.google.com/drive/1yaeRMAwhGkm1voaPp7EtFpSLF33EKhTc

标签: tensorflowtensorflow2.0tf.keras

解决方案



推荐阅读