python - 目标检测模型的性能上下跳跃
问题描述
我正在训练一个模型来从非洲农村的卫星图像中检测建筑物。对于标签,我使用 OpenStreetMap 几何图形。我使用 Tensorflow 对象检测 API 和 SSD Inception V2 作为模型,并使用默认配置文件。我在两个不同的数据集(在不同的地理区域)上训练了单独的模型。在一个领域,该模型的行为与我预期的一样:
请注意,我使用完全相同的模型、配置、批量大小、训练区域的大小等。在第二种情况下,模型的预测变化非常迅速,我不明白为什么。例如,这里是模型在 107k 和 108k 全局步长下的预测的比较(即我希望预测是相似的):
我对深度学习很陌生,无法理解为什么会发生这种情况。我可能忽略了一些简单的事情。我检查了标签,它们没问题。此外,我认为这可能是一个糟糕的批次,在每个时期都将训练转向错误的方向,但事实并非如此 - 性能下降最多几个时期。
我将非常感谢任何提示,等等。我使用的是 TF 1.14。
让我知道我是否应该提供更多信息。
解决方案
推荐阅读
- c# - Mongo自定义序列化程序导致无法创建抽象类
- python - 无法使用 Python 更改数据框列的值
- flutter - Flutter 在显示之前将 CashedNetworkImage 转换为 Base64
- .net - 对 Windows AD 用户使用匿名身份验证
- vue.js - 是否可以对 HTML 代码进行声明式呈现?
- tensorflow - 我的自定义损失函数中没有为任何变量提供梯度
- java - System.out.println 如何在线程级别工作?
- javascript - 动态图章 - acrobat pdf
- node.js - fastify-jwt 使用用户 ID 有效负载签名令牌
- java-8 - java.lang.OutOfMemoryError:在 hybris 中放置订单时出现 Java 堆空间错误