首页 > 解决方案 > 对于不同的数据集,相同的 CNN 模型是否需要不同的学习率?

问题描述

我使用卷积神经网络模型进行医学图像分割。当我训练模型(例如 Tiramisu 模型1)时,我尝试了论文中推荐的相同学习率,但是,我得到了不好的结果。

我担心的是,当我们将模型用于不同的数据集时,我们是否需要找到不同的最佳学习率。例如,在这种情况下,他们使用 CamVid 数据集(街道、汽车、人等),而我使用的是医学图像。

标签: deep-learningconv-neural-networkimage-segmentationtf.kerashyperparameters

解决方案


虽然可能有一些参数集在大多数情况下工作得很好(通常最终成为几个库的默认值),但最佳选择非常依赖于数据集。使用论文中的那些是获得基线的一个很好的起点,但永远不要阻止您尝试更改它们。

另一个重要的一点是损失函数,它可能适用于分割汽车(它们很大,超过图像的 20%),可能不适用于文本(小,小于图像的 1%)。

如果您有二进制分割,则使用阈值来确定像素是否是您想要的类别也很重要。


推荐阅读