首页 > 解决方案 > 在燃气表上执行 OCR

问题描述

我想在燃气表上执行 OCR,以便它可以读取值。我要执行 OCR 的仪表示例:

仪表

在这种情况下,OCR 应该返回 25539144。

如您所见,有一点问题:仪表周围有很多文字。所以一个普通的 OCR 库在这里不起作用,因为它也会返回它周围的文本。

我已经尝试过物体检测来检测仪表,但唯一一个似乎运行良好的(因为我只有 50 张图片)是 azure 认知服务。问题是稍后它应该能够在实时流中检测到它,因此无法使用 Web 服务。

任何人都可以帮助我朝着正确的方向解决这个问题吗?

标签: imageimage-processingmachine-learningcomputer-visionocr

解决方案


如果有关使用颜色的评论对您没有帮助,那么您可以尝试这种方法:

一种可能的方法是训练一个模型(可能是一个神经网络)来围绕使用数字绘制一个边界框。

您将不得不手动绘制几个框来提供训练示例。

一旦你运行了这个“边界框创建模型”,你就可以裁剪掉所有不相关的东西,你将拥有一个新的训练集,其中包含更容易学习的示例。

然后,您可以尝试在这个新数据集上重新训练您的 ocr 模型。


推荐阅读