首页 > 解决方案 > 给定表格结构的坐标,使用 Pytesseract 将文本提取到表格数组中

问题描述

我想从扫描的表格中提取文本tesseract并将其放入与表格具有相同结构的数组中。

我已经习惯opencv了检测表结构,得到了表关节的坐标以及整个表结构(存入np.array)。

例如,对于这张图片中的表格:
在此处输入图像描述

我想pytesseract将它存储到:

my_table = [[x, y, 1, 3],
            [x, a, 2, 3],
            [x, a, 2, 3],
            [x, z, 2, 3]]

我使用过商业 OCR 软件,它们总是首先检测表结构,然后识别并提取文本到检测到的表结构。

如何使用 pytesseract 完成第二步?在其他语言中使用 Tesseract 的答案也很棒。

标签: opencvocrtesseracttext-miningpython-tesseract

解决方案


推荐阅读