首页 > 解决方案 > 验证生成器批量大小

问题描述

我正在一个非常困难的数据集上训练一个 CNN。我得到了一些非常好的结果,但注意到我设法将验证生成器的批量大小设置为 1。不过,训练批量大小设置为 32。如果我知道将验证批量大小也更改为 32,那么我的结果很糟糕,而且我很难训练网络。

我只是无法理解为什么将验证批量大小设置为 1 或 32 会有任何差异。我使用 MSE 作为指标,并认为这只是所有样本的平均值。

那么为什么我会在批量大小为 1 时得到好的验证损失结果,而在批量大小为 32 时得到不好的验证损失结果呢?以 1 的批大小训练模型是否可以,或者在这种情况下我的模型是否过度训练?

提前感谢您的任何建议,

干杯,

迈克尔

标签: kerasdeep-learning

解决方案


推荐阅读