首页 > 解决方案 > 如何使用 tf.GradientTape 训练分支神经网络?

问题描述

我正在尝试使用 Keras 和 TF2 训练一个分支模型,其结构类似于此图像模型架构

基本上,我有一个图像数据集,它将通过一个编码器传递给我一个潜在向量作为结果。根据特定条件,开关会将此潜在向量传递给 4 个 DNN 之一。它们都产生自己的输出和损失,总损失是它们的总和。

所以,我的问题是,我应该如何使用 tf.GradientTape() 来跟踪梯度并更新模型可训练变量,因为小批量中的数据不会以一种方式流动?

Obs:我已经想出了一种在前进步骤中将潜在向量传递给正确 DNN 的方法。

标签: pythonkerastensorflow2.0gradienttapecustom-training

解决方案


推荐阅读