首页 > 解决方案 > TensorFlow Faster RCNN 配置文件中的 image_resizer 是什么意思

问题描述

使用 Tensorflow Faster RCNN 训练模型时,image_resizer 会对输入图像做什么?假设 Faster_RCNN 配置文件中的 image_resizer 设置为

image_resizer {
  keep_aspect_ratio_resizer {
    min_dimension: 1000
    max_dimension: 1000
  }
}

我有一个 1000*1000 像素的输入图像A.jpg,然后我通过使用第三方工具以 1.2 的比例调整(放大)该图像的大小来进行数据增强,这给了我另一个1200*1200 像素的图像B.jpg .

当这两张图片被输入到 Faster RCNN 模型时,图片缩放器会对 A.jpg 和 B.jpg 做什么?如果我理解正确的话,A.jpg 保持原样,B.jpg 将被调整为 1000*1000,这意味着调整后的 B.jpg 将与 A.jpg 完全相同?!那么,这种用于数据增强的图像大小调整没有用吗?

标签: object-detection

解决方案


如果我理解正确,您将图像放大以具有更大的对象,对吗?但是,您必须随时记住,如果大小大于输入大小,它将被调整为输入大小,您可能会失去增强效果。


推荐阅读