deep-learning - 深度学习:如何处理输入大小的变化
问题描述
我想做一个回归任务(在一些大小约为 150x 70 像素的图像中找到对象的 x,y 位置)。因此,我有大约 2000 个带注释的图像(我可以注释更多可能多达 20000 个)。我的第一个想法是使用 CNN,但我的输入数据的大小并不一致,我不想通过调整大小或裁剪图像来丢失特征。你怎么看?有没有比使用 CNN 更好的方法?如何处理这种图像尺寸的变化?
解决方案
好的,如果您不想重新缩放或裁剪,这就是问题所在。那么您将无法进行批处理。
您可以将输入图像缩放到一种尺寸。只需确保所有训练图像的大小相同,并且需要对您的基本事实(绑定框)进行类似的转换。
大问题:我不想将转换应用于边界框,这很复杂吗?
这是一个简单的库 Albumentations 可以为您完成所有这些工作。你不必担心数学库 - https://github.com/albumentations-team/albumentations
推荐阅读
- javascript - 如何使用 React/Redux/Formik 和 Yup 构建我的高阶组件?
- php - 如何找到字符串拆分的解决方案?
- kubernetes - Kubernetes.default nslookup 无法从不同的命名空间解析
- python - 如何从几个月到几年下采样并创建多级索引?
- powershell - Powershell单击“确定”以删除SP站点
- c# - SortedSet.Remove () 不适用于自定义比较器类
- laravel - 具有多个关系的模型的 Laravel Seeding DB
- r - 从R中的列表中删除非数字元素
- unix - 计算 UNIX 文件中字符串的出现次数
- c++ - 为什么比较 time_t 值时我的 While-Loop 没有停止?