ocr - tesseract 4.0.0-beta.1 字符周围的边界框
问题描述
我正在尝试使用 tesseract 4.0.0-beta.1 进行车牌识别。在 tesseract 文档中,它被告知以 . 我尝试使用“makebox”功能。但是,它并没有正确检测到每个字符。然后,在某处我读到此功能适用于 3.x 版。
后来我尝试了“wordstrbox”功能。但是这样创建的box文件是空的。有人可以告诉我如何为 tesseract 4.0.0-beta.1 创建盒子文件。
解决方案
我发现 AlfyFaisy 的回答非常有帮助,只想分享代码来查看单个字符的边界框。不同之处在于该方法输出的字典的键image_to_boxes
:
import pytesseract
import cv2
from pytesseract import Output
img = cv2.imread('image.png')
height = img.shape[0]
width = img.shape[1]
d = pytesseract.image_to_boxes(img, output_type=Output.DICT)
n_boxes = len(d['char'])
for i in range(n_boxes):
(text,x1,y2,x2,y1) = (d['char'][i],d['left'][i],d['top'][i],d['right'][i],d['bottom'][i])
cv2.rectangle(img, (x1,height-y1), (x2,height-y2) , (0,255,0), 2)
cv2.imshow('img',img)
cv2.waitKey(0)
至少在我的机器(Python 3.6.8,cv2 4.1.0)上,cv2 方法是waitKey(0)
大写的 K。
这是我得到的输出:
推荐阅读
- php - 如何使用 htaccess 为空间创建 RewriteRule
- c - 如何拆分此功能
- mongodb - Mongodb对象id和分页
- python - 我如何将意思归入熊猫中的特定列?
- ios - 使用 Objective-C 无法识别的新构建系统构建的 Swift 框架
- pdf - 如何将多页 PDF 表格转换为电子表格格式?
- javascript - 如何解决此“目标容器不是 DOM 元素”。在 React 与 React-Image Gallery/Lightbox 中?
- icalendar - 有没有办法导出 Mura 日历?
- delphi - 使用 Dblookupcombobox 过滤表中的相似记录
- c++ - 在n维中查找矩形的坐标