首页 > 解决方案 > 如何区分 OCR 中的斜线零和八(0-> 8)

问题描述

我正在为我的 Android 应用程序(ReCalc: Receipt Calculator)使用 ML Kit for Firebase,它的性能非常好,除了slashed zero的情况。在大约一半或更多的情况下,它将斜线零识别为八。

我的一个想法是在区域中分割包含零的矩形,并检测中间上方和下方的区域是否暗。但实际上...

我打算训练一个模型来分类 zeros 和 Eights

这是很多工作,因此我决定首先在这里寻求另一个解决方案/想法。

这是一个例子:

错误识别的零和八的示例

类似问题:Tesseract OCR 混淆 slashed 0 as 8

标签: machine-learningocrfirebase-mlkit

解决方案


最后我自己训练了一个模型。

它的准确率相当不错(超过 98%)。但是,我担心它的泛化程度如何。

这是项目:ZEC - Slashed Zero-Eight Classifier

我还创建了一个应用程序来展示如何在 Android 上使用该模型:ZECA - Slashed Zero-Eight Classifier for Android


推荐阅读