首页 > 解决方案 > tensorflow 对象检测 API 训练和导出图

问题描述

我有以下问题:当我用自己的数据集重新训练 TF 对象检测 API 时,训练经常被杀死,我不知道原因。没有错误日志,只是被杀死了。况且,为什么在我MODEL_DIR仅有的几model.ckpt-XXXX人中得救?

其次,当我尝试使用提供的脚本将上述模型导出到冻结图时,我在分析中看到形状不完整:

================== Model Analysis Report ======================
Incomplete shape.

model.cpkt-XXXX在训练过程被杀死后使用了a,是形状不完整的原因吗?

导出的模型可用于推理,但我想它不是最优的......

仅供参考,我已经用 1 个类重新训练了 mobileSSDv2,并且我已经修改了有关更改的管道配置文件,如下所示:

我在带有 python 2.7 的 virtualenv 中使用带有 tensoflow-GPU 1.12.0 的 ubuntu 16.04。

先感谢您。

标签: pythontensorflowdeep-learningobject-detectionobject-detection-api

解决方案


如果你使用的是 tensorflow-gpu 并且你有一个 GPU,那么200 是一个非常低的数字,你可以在几分钟内达到(你的 conv-net 什么也学不到)。至少将其增加到 100.000。

此外,由于训练步骤数量较少,您可能希望训练在开始(第 0 步)和结束训练(第 200 步)时保存您的模型,因此您只得到 2 个模型。

如果您不更改trainer.py中的save_interval_secs ,Tensorflow 每 600 秒保存一次模型


推荐阅读