r - 阅读带有文本、手写签名和方框填充的 PDF
问题描述
我在stackoverflow上或谷歌搜索后没有看到任何类型的答案。
我必须使用哪些 R 包将 PDF 读入 R,其中包含手写签名和已填写的框?
我有大量的 PDF 数据集,这些数据集几乎是要求标准内容的调查。姓名、号码、家庭住址、签名……这些 pdf 文件的一个很好的例子是大众健康应用程序https://www.mass.gov/files/2017-08/app.pdf。
1) 是否有 R 包可以读取带有签名或框填充的 PDF?
2) 我是否必须以其他格式保存这些 PDF,也许是 jpeg?
解决方案
除非您处理大量具有相同笔迹的文档,否则 OCR 技术还不够先进,无法将签名转换为机器可读的字符。计算机视觉还没有出现。您最好的选择可能是聘请一家公司手动转录大量信息。
推荐阅读
- ruby-on-rails - 在 rails 中下载由 XlsxWriter 创建的 XLSX 文件
- ios - SceneKit 子节点旋转
- reactjs - 在redux连接函数中将多个函数传递给mapDispatchToProps
- postgresql - 使用 Where.In(.., Seq[Long]) 时出现“运算符不存在:bigint = 字符变化”
- libgdx - 拆分后从精灵表中删除背景
- javascript - 如何在Javascript中将字符串转换为键/值对(映射)
- python - 等待 Plink -batch 命令完成
- jsonnet - 使用 jsonnet 更新现有数组元素
- ruby-on-rails - Rails 记录查询需要永远加载每条记录 1 到 1
- python - / 不支持的操作数类型:'list' 和 'int' Python