python - 实时摄像头馈送中的差异检测
问题描述
我面临着一个挑战,我得到了一张照片,我需要找到这张照片中的一个物体和我面前的一个物体之间的区别,我将使用 python 通过 IP 摄像机看到。 这是最初递给我的照片
这是来自 IP 摄像机的提要的样子
现在我应该编写一个程序来检测两个对象之间的差异和每个不同部分的颜色代码。如果它只包含这 2 张图片,这一切都很容易,但后者应该是来自相机的实时馈送,因此我编写的程序会因相机位置不同或曝光不同而导致差异不堪重负。
#!/usr/bin/env python
import cv2
from skimage import measure
import imutils
cap = cv2.VideoCapture(0)
img_gray = cv2.imread("pic1.png", 0)
img = cv2.imread("pic1.png")
while True:
_, frame = cap.read()
frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
(score, diff) = measure.compare_ssim(img_gray, frame_gray, full=True)#we won't use the score
diff = (diff * 255).astype("uint8") # converting the float score from a (-1,1) range to 8 bit 0-255 range
thresh = cv2.threshold(diff, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
contours = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
contours = imutils.grab_contours(contours)
for cnt in contours:
area = cv2.contourArea(cnt)
if 3150 < area:
(x,y,w,h) = cv2.boundingRect(cnt)
cv2.rectangle(frame, (x,y), (x+w, y+h), (0,255,0))
cv2.imshow("Current", frame)
cv2.imshow("Back then", img)
cv2.imshow("mask", thresh)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
cap.release()
cv2.destroyAllWindows()
现在彩色视频源上的输出应该是这样的
颜色编码不是问题
我尝试给绘制的轮廓一个设定的区域来绘制,显然它没有工作,ssim分数计算也没有。我应该如何解决这个问题,因为感觉就像我正在尝试重新发明已经构建的东西,但经过 2 周的尝试后我找不到。
解决方案
我再次写下我在您另一篇文章中的答案。您可以使用SimpleElastix。我更新了这些新图像的代码。请注意,顶部管道缺少图像的一部分,因此我们实际上不知道图像边界之后发生了什么,并且当前算法仅估计小部分的差异。
import cv2
import numpy as np
import matplotlib.pyplot as plt
import SimpleITK as sitk
movingImage = sitk.ReadImage('b1.png', sitk.sitkFloat32)
fixedImage = sitk.ReadImage('b2.png', sitk.sitkFloat32)
elastixImageFilter = sitk.ElastixImageFilter()
affine_registration_parameters = sitk.GetDefaultParameterMap('affine')
affine_registration_parameters["NumberOfResolutions"] = ['6']
affine_registration_parameters["WriteResultImage"] = ['false']
affine_registration_parameters["MaximumNumberOfSamplingAttempts"] = ['4']
spline_registration_parameters = sitk.GetDefaultParameterMap('bspline')
spline_registration_parameters["NumberOfResolutions"] = ['1']
spline_registration_parameters["WriteResultImage"] = ['false']
spline_registration_parameters["MaximumNumberOfSamplingAttempts"] = ['4']
spline_registration_parameters["Metric"] = ['AdvancedMattesMutualInformation']
spline_registration_parameters["GridSpacingSchedule"] = ['3']
print(spline_registration_parameters["Registration"])
parameterMapVector = sitk.VectorOfParameterMap()
parameterMapVector.append(affine_registration_parameters)
parameterMapVector.append(spline_registration_parameters)
elastixImageFilter.SetFixedImage(fixedImage)
elastixImageFilter.SetMovingImage(movingImage)
elastixImageFilter.SetParameterMap(parameterMapVector)
elastixImageFilter.Execute()
registeredImage = elastixImageFilter.GetResultImage()
transformParameterMap = elastixImageFilter.GetTransformParameterMap()
resultImage = sitk.Subtract(registeredImage, fixedImage)
resultImageNp = (np.sqrt(sitk.GetArrayFromImage(resultImage) ** 2) > 60)*255
cv2.imwrite('b_1.png', sitk.GetArrayFromImage(fixedImage))
cv2.imwrite('b_2.png', sitk.GetArrayFromImage(movingImage))
cv2.imwrite('b_2r.png', sitk.GetArrayFromImage(registeredImage))
cv2.imwrite('b_diff.png', resultImageNp.astype(np.uint8))
推荐阅读
- python-3.x - 了解梯度下降的类型及其在 Pytorch 框架中的计算方式并使其更具动态性
- scala - 如何在 Spark 中将多个列合并为 MapType?
- ssl - 如何在带有 SSL 的 nginx 反向代理后面正确运行 BeEF
- java - 如何为 JAR 文件 paermanenlty 设置类路径
- python-3.x - shutil.copy 在 os.makedirs 之后失败
- javascript - 反应本机 ArrayIndexOutOfBoundsException
- javascript - 将 Jquery 函数导入 React
- php - 在数据库表上插入表单数据取决于从下拉列表中选择的值
- python - 将 (x,x) 转换为数据框 pandas python
- c++ - 为什么虚函数不能是静态的和全局的?