首页 > 解决方案 > OCR 软件或自制 CNN 用于文档处理?

问题描述

我有一个难题。如果您只有一种类型的发票/文档,并且您有一个要从该发票处理并在其他地方使用的特定字段(该字段恰好是手写数字,有时用破折号或斜线书写),您会使用一些 OCR 软件或构建自己的 CNN 来识别数字?您希望 OCR 的准确度如何?你的 CNN 会更准确吗,因为你只对特定类型的数字书写感兴趣,具有特定的图像尺寸等。在给定的情况下,什么会更好?请记住,您不会以任何其他方式或任何其他地方使用它来识别手写数字,并且您已经有多达 100k 和更多的文档被人类复制到计算机,您可以将其用于培训和测试。

谢谢你。

标签: neural-networkartificial-intelligenceocrconv-neural-networkhandwriting-recognition

解决方案


我肯定会选择基于 CNN 的解决方案。由于您的文档结构是一致的:

  1. 使用标准的计算机视觉方法提取文档的所需部分
  2. 在数千个文档的注释集上训练 CNN。您甚至应该能够微调在 MNIST 上训练的现有 CNN,这将需要更少的训练图像。

这种方法应该可以毫不费力地为您提供 >99% 的准确度。OCR 解决方案的准确性实际上取决于您使用的库和您实施的预处理。


推荐阅读