首页 > 解决方案 > allennlp 的 GradientDescentTrainer 多久更新一次模型?

问题描述

GradientDescentTrainer 是否在每个 epoch 结束时更新模型?还是在批次前向传递后更新一次?

标签: allennlp

解决方案


GradientDescentTrainer“反向传递”之后每批更新模型(假设您没有使用梯度累积)。


推荐阅读