首页 > 解决方案 > 如何从支票图像中提取支票金额?

问题描述

我正在尝试从支票图像中提取支票金额(输入图像中带下划线的文本)。我试图通过以下两个步骤来做到这一点:

  1. 在图像中找到金额的矩形框。
  2. 使用诸如 Tesseract OCR 之类的 OCR 库执行 OCR 并获取文本。

我试图找到矩形框,但它从图像中找到了很多东西。

我们如何解决这个问题?如果有人有不同的方法来提取金额,请指导我。

我的代码

import numpy as np
import cv2
img = cv2.imread("Ex2.jpg")

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY_INV)
contours,_ = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)

for contour in contours:
    (x,y,w,h) = cv2.boundingRect(contour)
    cv2.rectangle(img, (x,y), (x+w,y+h), (0,255,0), 2)
    cv2.imshow('detected.jpg',img)
cv2.waitKey(0)
cv2.destroyAllWindows()

输入图像 输入图像

目前,我得到了这个。

检测到的图像

标签: python-3.xopencvimage-processingtext-extraction

解决方案


推荐阅读