deep-learning - 对于不同的数据集,相同的 CNN 模型是否需要不同的学习率?
问题描述
我使用卷积神经网络模型进行医学图像分割。当我训练模型(例如 Tiramisu 模型1)时,我尝试了论文中推荐的相同学习率,但是,我得到了不好的结果。
我担心的是,当我们将模型用于不同的数据集时,我们是否需要找到不同的最佳学习率。例如,在这种情况下,他们使用 CamVid 数据集(街道、汽车、人等),而我使用的是医学图像。
解决方案
虽然可能有一些参数集在大多数情况下工作得很好(通常最终成为几个库的默认值),但最佳选择非常依赖于数据集。使用论文中的那些是获得基线的一个很好的起点,但永远不要阻止您尝试更改它们。
另一个重要的一点是损失函数,它可能适用于分割汽车(它们很大,超过图像的 20%),可能不适用于文本(小,小于图像的 1%)。
如果您有二进制分割,则使用阈值来确定像素是否是您想要的类别也很重要。
推荐阅读
- asp.net - 使用 Javascript 发布导致空会话
- python - Backtrader - 交易不在 .plot 上排队
- javascript - 创建了按父 ID 分组的嵌套列表
- android - 颤振:意图
- java - Mockito:如何在不调用其方法的情况下模拟构造函数参数
- apache-kafka - Kafka Connect Elasticsearch Sink 连接器指标
- javascript - 在渲染 React Resume 和 Portfolio 组件时遇到问题 - Header、Footer 和 Profile 组件都可以正常渲染
- javascript - 为什么这个数组键会被转换为 JavaScript 中的基本数据类型?
- javascript - 如何检查文本是否不包含空格或表情符号?
- python - 在 Django 多租户 API 中请求特定视图