首页 > 解决方案 > 如何使用 CNN 预测孔的中心坐标

问题描述

我有一个包含 2000 张图像的数据集,看起来像这样https://imgur.com/a/IG3yLpe

目标是使用 CNN 预测圆角矩形的中心点 (x,y)。与训练图像关联的中心点作为训练标签提供。

这是我的程序的一般流程:

  1. 将原始图像 (2592 x 1944) 裁剪为 (2092 x 544) 的感兴趣区域 (ROI)
  2. 使用数据增强技术(旋转、高斯噪声、亮度、缩放、移位)将图像数量增加到 20000。
  3. 将增强的 ROI 图像裁剪为 64x64 numpy 数组(不保留纵横比)
  4. 使用 10% 的数据集作为验证集
  5. 将上述图像拟合到 CNN 模型中。我使用默认的 Adam 优化器。模型摘要和训练结果在此文件中 https://gofile.io/?c=G9z8Y7 "
  6. 在整个数据集 + 100 个测试图像上评估模型
  7. 将预测结果与基本事实进行比较

我使用 val_mae 指标来衡量成功。尽管 val_mae 达到了 0.61,但我对预测结果并不满意。最高的 x 间隙为 3.4 像素,只有 50% 的图像达到了我的目标(x_gap < 1px 和 y_gap < 1px)。

我应该如何调整我的 CNN 模型以实现我的目标

谢谢您的帮助

标签: pythontensorflowkerasregression

解决方案


推荐阅读