neural-network - OCR 软件或自制 CNN 用于文档处理?
问题描述
我有一个难题。如果您只有一种类型的发票/文档,并且您有一个要从该发票处理并在其他地方使用的特定字段(该字段恰好是手写数字,有时用破折号或斜线书写),您会使用一些 OCR 软件或构建自己的 CNN 来识别数字?您希望 OCR 的准确度如何?你的 CNN 会更准确吗,因为你只对特定类型的数字书写感兴趣,具有特定的图像尺寸等。在给定的情况下,什么会更好?请记住,您不会以任何其他方式或任何其他地方使用它来识别手写数字,并且您已经有多达 100k 和更多的文档被人类复制到计算机,您可以将其用于培训和测试。
谢谢你。
解决方案
我肯定会选择基于 CNN 的解决方案。由于您的文档结构是一致的:
- 使用标准的计算机视觉方法提取文档的所需部分
- 在数千个文档的注释集上训练 CNN。您甚至应该能够微调在 MNIST 上训练的现有 CNN,这将需要更少的训练图像。
这种方法应该可以毫不费力地为您提供 >99% 的准确度。OCR 解决方案的准确性实际上取决于您使用的库和您实施的预处理。
推荐阅读
- powershell - Powershell - 如何替换扩展名以外的文件上的点
- python - 使用 spark.sparkContext.addPyFile 导入 Pandas UDF
- ios - SwiftUI有条件显示的按钮在按住单独的LongPressGesture“Shift”按钮时忽略第一次点击
- python - 如何使用 Tesseract 识别图像上两个数字之间的斜线?
- python - 错误:无法使用 sympy 获得拉普拉斯逆变换表达式
- reactjs - Apollo 缓存坚持不返回数据
- webdriver-io - Webdriver IO Setup 背后的合作 Proxy
- python - 类型错误:click() 缺少 1 个必需的位置参数:'y'。尝试进行简单的右键单击
- blockchain - 如何构建 IPFS 基础元数据 URI?
- javascript - 在解决新的 Promise 后如何使用 .then() ,然后将整个函数返回为已解决