python - Python OCR - 从 PDF 表单中提取笔迹
问题描述
我已经看到了很多与此有关的问题,但没有一个真正让我到达我想去的地方。
目标很简单:我有一批 PDF 表格,在所有表格的特定位置(右上角)都有手写日期。我想扫描这些表格,将手写日期转换为变量,然后将其插入 Excel。
我知道很多用户推荐 Tesseract 或 Tensorflow,但我不确定他们是否有能力在 PDF 上指定一个位置来提取而不是整个文档。我知道你可以训练他们学习用户的笔迹,所以这就是计划。
如果有人能指出我正确的方向,我将不胜感激。
解决方案
推荐阅读
- html - Rails 根据条件在 html 代码上包装 link_to
- javascript - Redux:连接函数中的对象解构?
- multithreading - Scala 原生线程和 GC 问题
- node.js - MongoDB,如何使用 $geoNear 检索给定范围内的文档
- python - 登录 Behave BDD 框架
- php - 是否可以从 SQL 触发器中的两个单独的表中减去两个列?
- r - 在闪亮的应用程序中上传文件并通过 textInput() 设置其名称
- apache-spark - Spark:如何在横向视图中包含空行爆炸
- web-services - Web 服务和 DataContractJsonSerializer :处理字典
- javascript - 我第一次加载页面时收到“TypeError:表单未定义”