首页 > 解决方案 > CNN中这种训练损失曲线的原因可能是什么?

问题描述

我已经训练了一个用于图像分类的 CNN,但是我得到了如下的损失曲线,x 轴是 epoch,y 轴是损失,是学习率太大还是太小?我只使用亚当,lr 是 0.001。
损失曲线

标签: deep-learningcomputer-vision

解决方案


您的模型很可能是过度拟合的,这意味着它学习的模式不是通用的。虽然减少是训练损失是好的,它表示你的模型正在学习。通过查看验证损失曲线可以找到时代增加但学习的真正代表。

为了克服过度拟合,您可以添加Dropout层,该层随机选择一些隐藏单元并将其权重设置为零。也可能是您要训练的数据较少。

关于这个主题,还有其他一些事情需要了解。


推荐阅读