首页 > 解决方案 > 图像分类器中随机缩放/裁剪/亮度的值是多少

问题描述

当我们在 Mobilenet 中重新训练图像分类层时,重新训练脚本允许我们指定几个参数来预处理输入图像:

random_scale random_crop random_brightness

我想知道如何确定这些值?我在一些文章中看到他们将 random_brightness 和 random_scale 设置为 30,并将 random_crop 设置为 0。

有人可以帮我理解这些参数吗?

标签: tensorflowclassificationtensorflow-datasetstensorflow-slim

解决方案


从这个链接找到答案:https ://github.com/tensorflow/hub/blob/master/docs/tutorials/image_retraining.md

改善图像训练结果的一种常见方法是以随机方式对训练输入进行变形、裁剪或增亮。由于相同图像的所有可能变化,这具有扩展训练数据的有效大小的优势,并且倾向于帮助网络学习应对分类器在实际使用中将发生的所有失真。在我们的脚本中启用这些扭曲的最大缺点是瓶颈缓存不再有用,因为输入图像永远不会被精确地重用。这意味着训练过程需要更长的时间(好几个小时),因此建议您仅在拥有一个您相当满意的模型后尝试使用此方法来完善您的模型。


推荐阅读