首页 > 解决方案 > 阅读带有文本、手写签名和方框填充的 PDF

问题描述

我在stackoverflow上或谷歌搜索后没有看到任何类型的答案。

我必须使用哪些 R 包将 PDF 读入 R,其中包含手写签名和已填写的框?

我有大量的 PDF 数据集,这些数据集几乎是要求标准内容的调查。姓名、号码、家庭住址、签名……这些 pdf 文件的一个很好的例子是大众健康应用程序https://www.mass.gov/files/2017-08/app.pdf

1) 是否有 R 包可以读取带有签名或框填充的 PDF?

2) 我是否必须以其他格式保存这些 PDF,也许是 jpeg?

标签: rpdftensorflowjpeg

解决方案


除非您处理大量具有相同笔迹的文档,否则 OCR 技术还不够先进,无法将签名转换为机器可读的字符。计算机视觉还没有出现。您最好的选择可能是聘请一家公司手动转录大量信息。


推荐阅读