首页 > 解决方案 > Python OCR - 从 PDF 表单中提取笔迹

问题描述

我已经看到了很多与此有关的问题,但没有一个真正让我到达我想去的地方。

目标很简单:我有一批 PDF 表格,在所有表格的特定位置(右上角)都有手写日期。我想扫描这些表格,将手写日期转换为变量,然后将其插入 Excel。

我知道很多用户推荐 Tesseract 或 Tensorflow,但我不确定他们是否有能力在 PDF 上指定一个位置来提取而不是整个文档。我知道你可以训练他们学习用户的笔迹,所以这就是计划。

如果有人能指出我正确的方向,我将不胜感激。

标签: pythonocrtesseractpython-tesseract

解决方案


推荐阅读