首页 > 解决方案 > 如何在图像中找到对象的区域边界框

问题描述

我有这样的图像及其蒙版:

面具

original_im

如何使用遮罩识别对象周围的矩形边界框?所以最终的结果应该是这样的(去掉背景): 在此处输入图像描述

import urllib
from io import BytesIO

url_mask = "https://i.stack.imgur.com/rIyJ6.png"
f = urllib.request.urlopen(url_mask)
mask = Image.open(BytesIO(f.read()))

url_im = "https://i.stack.imgur.com/msm7L.jpg"
f2 = urllib.request.urlopen(url_im)
img = Image.open(BytesIO(f2.read()))

标签: pythonopencv

解决方案


如果您不使用 cv2,那么您可以查看所有像素并找到等于 1 的 xmin、xmax、ymin ymax。因为黑色通常表示为 0,而白色通常表示为 1。


推荐阅读