deep-learning - 深度学习：如何处理输入大小的变化

问题描述

我想做一个回归任务（在一些大小约为 150x 70 像素的图像中找到对象的 x,y 位置）。因此，我有大约 2000 个带注释的图像（我可以注释更多可能多达 20000 个）。我的第一个想法是使用 CNN，但我的输入数据的大小并不一致，我不想通过调整大小或裁剪图像来丢失特征。你怎么看？有没有比使用 CNN 更好的方法？如何处理这种图像尺寸的变化？

标签： deep-learningregressionconv-neural-networkobject-detection

好的，如果您不想重新缩放或裁剪，这就是问题所在。那么您将无法进行批处理。

您可以将输入图像缩放到一种尺寸。只需确保所有训练图像的大小相同，并且需要对您的基本事实（绑定框）进行类似的转换。

大问题：我不想将转换应用于边界框，这很复杂吗？

这是一个简单的库 Albumentations 可以为您完成所有这些工作。你不必担心数学库 - https://github.com/albumentations-team/albumentations

deep-learning - 深度学习：如何处理输入大小的变化

问题描述

解决方案

推荐阅读