首页 > 解决方案 > TensorFlow训练,如何防止训练节点被删除

问题描述

我正在使用 TensorFlow 和 python 进行对象检测。

我想开始训练并保留一段时间并保留所有训练节点(model-cpk)。标准的 TensorFlow 训练似乎删除了节点,只保留了最后几个节点。我该如何防止呢?

如果这是问此类问题的错误地方,请原谅。如果被告知一个合适的地方,我将不得不这样做。谢谢你。

标签: pythontensorflowmachine-learning

解决方案


您可以使用keep_checkpoint_max标志来tf.estimator.RunConfig输入model_main.py。您可以将其设置为非常大的数字以实际保存所有检查点。您应该被警告,根据模型大小和保存频率,它可能会填满您的磁盘(并因此在训练期间崩溃)。您可以通过标志save_checkpoints_steps或更改保存频率save_checkpoints_secsRunConfig默认使用save_checkpoints_secs,默认值为 600(10 分钟)。


推荐阅读