python - 查找轮廓的边缘强度/大小以查找和排除模糊对象
问题描述
我想使用 python 为灰度图像中的每个对象找到一个边缘强度值。我通过阈值检测对象以创建二进制图像,然后通过 opencv findContours 为我提供边缘。我在每张图像中检测到的一些对象是模糊的,我想根据轮廓边缘梯度的大小将它们排除在外(有关焦点对象和模糊对象的示例,请参见下图)。处理每个轮廓的边缘强度以给出每个对象的边缘强度值的最佳方法是什么,以便我可以根据我可以计算出的某个阈值排除模糊的边缘强度?
contours, hierarchy = cv2.findContours(binary_img, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
edges = cv2.drawContours(original_image, contours, -1, (255, 255, 255), 1)
我在通过阈值生成的二进制图像上使用上述代码来绘制原始图像上的边缘。下一步是发送检测到的对象进行处理,但我希望排除模糊对象,因为它们不需要进一步分析。下面的图片显示了一个边缘绘制的图像,我想找到一些值来描述我找到的每个对象的每个边缘像素的平均边缘梯度,并且只进一步处理那些边缘幅度高于某个阈值的人,也就是在重点。
原图:
有边缘:
解决方案
这是一种潜在的方法
- 将图像转换为灰度
- 获取二值图像的自适应阈值
- 扩张以增强轮廓
- 查找轮廓并提取 ROI
- 执行拉普拉斯变体以进行模糊检测
我们首先转换为灰度和自适应阈值
import cv2
import numpy as np
image = cv2.imread('1.jpg')
result = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255,cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
接下来我们进行扩张以增强轮廓
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5,5))
dilate = cv2.dilate(thresh, kernel, iterations=3)
现在我们找到轮廓并提取每个 ROI。我们使用拉普拉斯算子的变化对此 ROI 轮廓进行模糊检测。
cv2.Laplacian(image, cv2.CV_64F).var()
本质上,我们获取图像的单个通道并将其与以下3x3
内核进行卷积,并获取响应的标准差平方。如果方差低于定义的阈值,则 ROI 模糊,否则 ROI 不模糊。请查看此博客文章以了解更多详细信息
[0 1 0]
[1 -4 1]
[0 1 0]
这是结果
ROI_Number:1,值:27.655757845590053
ROI_Number:2,值:7.385658155007905
ROI_num = 0
for c in cnts:
x,y,w,h = cv2.boundingRect(c)
ROI = image[y:y+h, x:x+w]
value = cv2.Laplacian(ROI, cv2.CV_64F).var()
cv2.rectangle(result, (x, y), (x + w, y + h), (36,255,12), 2)
cv2.putText(result, "{0:.2f}".format(value), (x,y - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (36,255,12), 2)
cv2.imshow("ROI_{}".format(ROI_num), ROI)
ROI_num += 1
print('ROI_Number: {}, Value: {}'.format(ROI_num, value))
这是另一张图片的结果
ROI_Number:1,值:23.96665214233842
ROI_Number:2,值:67.59560601952461
完整代码
import cv2
import numpy as np
image = cv2.imread('1.jpg')
result = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255,cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5,5))
dilate = cv2.dilate(thresh, kernel, iterations=3)
cnts = cv2.findContours(dilate, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
ROI_num = 0
for c in cnts:
x,y,w,h = cv2.boundingRect(c)
ROI = image[y:y+h, x:x+w]
value = cv2.Laplacian(ROI, cv2.CV_64F).var()
cv2.rectangle(result, (x, y), (x + w, y + h), (36,255,12), 2)
cv2.putText(result, "{0:.2f}".format(value), (x,y - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (36,255,12), 2)
cv2.imshow("ROI_{}".format(ROI_num), ROI)
ROI_num += 1
print('ROI_Number: {}, Value: {}'.format(ROI_num, value))
cv2.imshow('thresh', thresh)
cv2.imshow('dilate', dilate)
cv2.imshow('result', result)
cv2.waitKey(0)
推荐阅读
- typescript - 打字稿:只选择一个工会
- javascript - 即使它获得了新参数,API 的 React setState 也不会更新
- google-apps-script - Google 脚本 - 电子邮件 - Html for 循环
- python - 在 PyQt5 中实现画布
- user-interface - 升级到 Ubuntu 18 后,KDiff3 缺少窗口控件
- html - 将网格空div显示为间隔?
- python - OSError:无法打开文件(未找到文件签名)h5 文件
- android - 日历应用程序是否需要使用日历提供程序?
- ruby-on-rails - Rails 数据库查询 .order GREATEST 忽略 NULL 或空
- android - 如何使 Firebase 数据库值仅对其各自配对的 UID 可见?