python - tensorflow 对象检测 API 训练和导出图
问题描述
我有以下问题:当我用自己的数据集重新训练 TF 对象检测 API 时,训练经常被杀死,我不知道原因。没有错误日志,只是被杀死了。况且,为什么在我MODEL_DIR
仅有的几model.ckpt-XXXX
人中得救?
其次,当我尝试使用提供的脚本将上述模型导出到冻结图时,我在分析中看到形状不完整:
================== Model Analysis Report ======================
Incomplete shape.
我model.cpkt-XXXX
在训练过程被杀死后使用了a,是形状不完整的原因吗?
导出的模型可用于推理,但我想它不是最优的......
仅供参考,我已经用 1 个类重新训练了 mobileSSDv2,并且我已经修改了有关更改的管道配置文件,如下所示:
- 我将班级人数更改为 1
- 在训练
config {}
部分,我将批量大小更改为 12,并将步数设置为 200 train_input_reader
和eval_input_reader {}
部分,我已经将我的路径添加到 TF 记录和labelmap.pbtxt
- 在
eval_config {}
某种程度上,我已将示例数更改为 85(我的 eval 图像存储库中的图片数),并将 max eval 更改为 5。
我在带有 python 2.7 的 virtualenv 中使用带有 tensoflow-GPU 1.12.0 的 ubuntu 16.04。
先感谢您。
解决方案
如果你使用的是 tensorflow-gpu 并且你有一个 GPU,那么200 是一个非常低的数字,你可以在几分钟内达到(你的 conv-net 什么也学不到)。至少将其增加到 100.000。
此外,由于训练步骤数量较少,您可能希望训练在开始(第 0 步)和结束训练(第 200 步)时保存您的模型,因此您只得到 2 个模型。
如果您不更改trainer.py中的save_interval_secs ,Tensorflow 每 600 秒保存一次模型
推荐阅读
- c# - 完全递归爬虫不起作用。只有 2-3 个页面爬取深度
- node.js - create-react-app 后无法启动项目:错误:找不到模块“C:\Users\pcname\Documents\react-scripts\bin\react-scripts.js”
- mysql - 仅当子表中的外键在父表中具有分配给它的值时,才在子表中创建条目
- javascript - 如何使用按键阻止我的形状移动?
- json - 如何使用 Dart 中属性名称的枚举将 JSON 映射到对象
- xamarin.ios - 导航控制器设置为空,使用 UITabBarController
- python - Selenium/python - “查找部分链接文本”和“xpath”
- html - CSS z-index 谜题
- node.js - MEAN - 未找到 Http Put 请求 404
- python - 使用另一个列表测试列表的内容