python - tensorflow 对象检测 API 训练和导出图

我有以下问题：当我用自己的数据集重新训练 TF 对象检测 API 时，训练经常被杀死，我不知道原因。没有错误日志，只是被杀死了。况且，为什么在我MODEL_DIR仅有的几model.ckpt-XXXX人中得救？

其次，当我尝试使用提供的脚本将上述模型导出到冻结图时，我在分析中看到形状不完整：

================== Model Analysis Report ======================
Incomplete shape.

我model.cpkt-XXXX在训练过程被杀死后使用了a，是形状不完整的原因吗？

导出的模型可用于推理，但我想它不是最优的......

仅供参考，我已经用 1 个类重新训练了 mobileSSDv2，并且我已经修改了有关更改的管道配置文件，如下所示：

我将班级人数更改为 1
在训练config {}部分，我将批量大小更改为 12，并将步数设置为 200
train_input_reader和eval_input_reader {}部分，我已经将我的路径添加到 TF 记录和labelmap.pbtxt
在eval_config {}某种程度上，我已将示例数更改为 85（我的 eval 图像存储库中的图片数），并将 max eval 更改为 5。

我在带有 python 2.7 的 virtualenv 中使用带有 tensoflow-GPU 1.12.0 的 ubuntu 16.04。

先感谢您。

标签： pythontensorflowdeep-learningobject-detectionobject-detection-api

如果你使用的是 tensorflow-gpu 并且你有一个 GPU，那么200 是一个非常低的数字，你可以在几分钟内达到（你的 conv-net 什么也学不到）。至少将其增加到 100.000。

此外，由于训练步骤数量较少，您可能希望训练在开始（第 0 步）和结束训练（第 200 步）时保存您的模型，因此您只得到 2 个模型。

如果您不更改trainer.py中的save_interval_secs ，Tensorflow 每 600 秒保存一次模型