image - 在燃气表上执行 OCR
问题描述
我想在燃气表上执行 OCR,以便它可以读取值。我要执行 OCR 的仪表示例:
在这种情况下,OCR 应该返回 25539144。
如您所见,有一点问题:仪表周围有很多文字。所以一个普通的 OCR 库在这里不起作用,因为它也会返回它周围的文本。
我已经尝试过物体检测来检测仪表,但唯一一个似乎运行良好的(因为我只有 50 张图片)是 azure 认知服务。问题是稍后它应该能够在实时流中检测到它,因此无法使用 Web 服务。
任何人都可以帮助我朝着正确的方向解决这个问题吗?
解决方案
如果有关使用颜色的评论对您没有帮助,那么您可以尝试这种方法:
一种可能的方法是训练一个模型(可能是一个神经网络)来围绕使用数字绘制一个边界框。
您将不得不手动绘制几个框来提供训练示例。
一旦你运行了这个“边界框创建模型”,你就可以裁剪掉所有不相关的东西,你将拥有一个新的训练集,其中包含更容易学习的示例。
然后,您可以尝试在这个新数据集上重新训练您的 ocr 模型。
推荐阅读
- c++ - GMock - 用另一个实现模拟一个抽象类
- qaf - 报告未在 qmetry 的仪表板 html 页面中显示?
- asp.net-mvc-4 - URL /%20/ 使用外部 connectionStrings 或 appSettings 文件引发配置文件错误
- node.js - 如何将这个完整的查询与 sequelizejs 一起使用
- java - 我实现生产者-消费者问题的方法是否正确?
- mysql - 修复“预期语句结束”
- javascript - 如何使用 chart.js 仅绘制图形和 Xaxis 网格线
- karate - 将 json 数组项与 json 数组项的随机顺序的响应进行比较
- javascript - 工作箱缓存策略无法正常工作
- algorithm - 最长公共两个字符串集