python - 正方体边界框距离计算
问题描述
我正在尝试应用 tesseract OCR 从图像中提取文本。起初,我尝试了 image_to_data,它返回了文本,但在某些情况下,它给出了错误的字符。然后我尝试了 image_to_boxes ,它非常正确地返回了每个字符。但我的问题是,我需要连接这些字符来组成完整的单词。谁能向我建议我该怎么做?我的意思是说我需要从这本字典中造出三个单词,例如“~Phone”、“:”、“+88-02-5042248-50”。
最后,谁能解释一下这本词典中的左、下、右和上是什么意思?我可以用它们来查找两个字符之间的距离吗?
解决方案
import cv2
import numpy as np
import pytesseract
# Load image
image = cv2.imread('muTYX.jpg')
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
text = pytesseract.image_to_string(image, lang = 'eng', config='--psm 7 --oem 3 ')
text = (text.split('\n'))
print(text[0].split(' '))
输出:['电话',':','+88-02-55042248-50']
的字典image_to_boxes
是这样的:
#(index of character, start x-axis, start y-axis, end x-axis, end y-axis)
P 53 50 64 76 0
h 63 50 75 77 0
...
推荐阅读
- setinterval - 有什么方法可以在触发新的 setInterval 之前清除之前的 setInterval
- symfony - 如何在 collectionType 字段上获取数据() - Symfony 4
- ruby-on-rails - 在 create-react-app 端访问 Rails 会话
- arrays - 在数组中查找单个未排序元素的有效方法
- python - 通过 jupyter notebook 从串行捕获数据的问题
- mysql - 为什么 SHOW GLOBAL VARIABLES LIKE 'local_infile' 有时会关闭
- macos - 使用 MacOS 和 CMake 包含 omp.h 库时出错
- sql - AWS Redshift:如果用户不存在,我可以使用案例语句创建新用户吗?
- c# - EditorConfig - 简化布尔评估?
- java - 未经检查的强制转换:由 Class 包装的通配符到由 Class 包装的另一种类型