首页 > 解决方案 > 在 swift 中使用 OCR 扫描发票

问题描述

我目前正在使用 OCR 扫描来扫描发票。所有发票都使用“OCRB”字体,并具有相同的格式。

示例发票的底部如下所示

在此处输入图像描述

这是用户需要扫描的。

我尝试了许多不同的库来检测我想要的东西。但是大多数图书馆都没有给我正确的结果。最好的结果来自 Firebase ML Vision 文本识别。但是我得到的结果是这样的:

在此处输入图像描述

我可以计算出这些值是否正确,除了中间显示的金额。在这种情况下,它显示为“3557 00”,但如果用户将相机向右移动一点,我得到的结果是“557 00”。由于 MLKit 和其他库都绕着这个词,我不知道是否提供了完整的总和。

如果我在单词前有一个空格,我可以得到一个完整的“单词”,在这种情况下是一个总和。

任何人都知道如何使用什么库来获得最佳结果?

标签: swiftocrfirebase-mlkittext-recognition

解决方案


推荐阅读