python - 目标检测模型的性能上下跳跃

问题描述

我正在训练一个模型来从非洲农村的卫星图像中检测建筑物。对于标签，我使用 OpenStreetMap 几何图形。我使用 Tensorflow 对象检测 API 和 SSD Inception V2 作为模型，并使用默认配置文件。我在两个不同的数据集（在不同的地理区域）上训练了单独的模型。在一个领域，该模型的行为与我预期的一样：

然而，当在其他领域训练模型时，它的性能会上下跳跃：

请注意，我使用完全相同的模型、配置、批量大小、训练区域的大小等。在第二种情况下，模型的预测变化非常迅速，我不明白为什么。例如，这里是模型在 107k 和 108k 全局步长下的预测的比较（即我希望预测是相似的）：

我对深度学习很陌生，无法理解为什么会发生这种情况。我可能忽略了一些简单的事情。我检查了标签，它们没问题。此外，我认为这可能是一个糟糕的批次，在每个时期都将训练转向错误的方向，但事实并非如此 - 性能下降最多几个时期。

我将非常感谢任何提示，等等。我使用的是 TF 1.14。

让我知道我是否应该提供更多信息。

标签： pythontensorflowmachine-learningdeep-learningobject-detection

python - 目标检测模型的性能上下跳跃

问题描述

解决方案

推荐阅读