首页 > 解决方案 > 深度学习:如何处理输入大小的变化

问题描述

我想做一个回归任务(在一些大小约为 150x 70 像素的图像中找到对象的 x,y 位置)。因此,我有大约 2000 个带注释的图像(我可以注释更多可能多达 20000 个)。我的第一个想法是使用 CNN,但我的输入数据的大小并不一致,我不想通过调整大小或裁剪图像来丢失特征。你怎么看?有没有比使用 CNN 更好的方法?如何处理这种图像尺寸的变化?

标签: deep-learningregressionconv-neural-networkobject-detection

解决方案


好的,如果您不想重新缩放或裁剪,这就是问题所在。那么您将无法进行批处理。

您可以将输入图像缩放到一种尺寸。只需确保所有训练图像的大小相同,并且需要对您的基本事实(绑定框)进行类似的转换。

大问题:我不想将转换应用于边界框,这很复杂吗?

这是一个简单的库 Albumentations 可以为您完成所有这些工作。你不必担心数学库 - https://github.com/albumentations-team/albumentations


推荐阅读