swift - 在 swift 中使用 OCR 扫描发票
问题描述
我目前正在使用 OCR 扫描来扫描发票。所有发票都使用“OCRB”字体,并具有相同的格式。
示例发票的底部如下所示
这是用户需要扫描的。
我尝试了许多不同的库来检测我想要的东西。但是大多数图书馆都没有给我正确的结果。最好的结果来自 Firebase ML Vision 文本识别。但是我得到的结果是这样的:
我可以计算出这些值是否正确,除了中间显示的金额。在这种情况下,它显示为“3557 00”,但如果用户将相机向右移动一点,我得到的结果是“557 00”。由于 MLKit 和其他库都绕着这个词,我不知道是否提供了完整的总和。
如果我在单词前有一个空格,我可以得到一个完整的“单词”,在这种情况下是一个总和。
任何人都知道如何使用什么库来获得最佳结果?
解决方案
推荐阅读
- rxjs - 如何有条件地从ngrx中的效果调度多个动作
- excel - 数据框到 Excel 工作表未按预期工作
- java - 使用 Mockito 和来自 Cloud Firestore 的异步调用编写测试时出错
- java - 无法向 Firebase 实时数据库添加权限
- javascript - 将值映射到堆积条形图
- node.js - 在本地 VS Code 中调试 Puppeteer NodeJS 应用程序时启动 Chrome
- ruby-on-rails - Ruby 2.4 和 BigDecimal 错误(无效值)
- imagemagick - 使用 ImageMagick 将 PDF 转换为具有不同分辨率的图像
- r - 按日期转置行相乘
- python - 用于将 pandas 功能与 keras CSVLogger 混合的 Python 面向对象的解决方案