首页 > 解决方案 > 目标检测模型的性能上下跳跃

问题描述

我正在训练一个模型来从非洲农村的卫星图像中检测建筑物。对于标签,我使用 OpenStreetMap 几何图形。我使用 Tensorflow 对象检测 API 和 SSD Inception V2 作为模型,并使用默认配置文件。我在两个不同的数据集(在不同的地理区域)上训练了单独的模型。在一个领域,该模型的行为与我预期的一样:

卡龙加

然而,当在其他领域训练模型时,它的性能会上下跳跃: 在此处输入图像描述

请注意,我使用完全相同的模型、配置、批量大小、训练区域的大小等。在第二种情况下,模型的预测变化非常迅速,我不明白为什么。例如,这里是模型在 107k 和 108k 全局步长下的预测的比较(即我希望预测是相似的):

在此处输入图像描述

我对深度学习很陌生,无法理解为什么会发生这种情况。我可能忽略了一些简单的事情。我检查了标签,它们没问题。此外,我认为这可能是一个糟糕的批次,在每个时期都将训练转向错误的方向,但事实并非如此 - 性能下降最多几个时期。

我将非常感谢任何提示,等等。我使用的是 TF 1.14。

让我知道我是否应该提供更多信息。

标签: pythontensorflowmachine-learningdeep-learningobject-detection

解决方案


推荐阅读