首页 > 解决方案 > 有没有办法避免车牌中不需要的文本?

问题描述

我是车牌识别的新手。我正在使用 Goggle 的 Vision API(OCR) 从图像中提取文本。但这会从车牌中提取所有文本。例如,考虑下图

在此处输入图像描述

我只需要获得许可证号6TRJ244,但我会从车牌中获得所有文本,例如california AUF 2012dmv.ca.gov

谁能指导我如何避免其他文本并仅提取许可证号?请分享任何其他车牌识别方法,我也可以尝试。谢谢

标签: deep-learningocrobject-detectiongoogle-vision

解决方案


您可以为此使用正则表达式。许可证编号将采用特定区域的特定格式。我不知道您所在国家/地区的车牌系统,但对于示例中显示的许可证号,它是一个数字,后跟 3 个字母,然后是 3 个数字。

我能想到的最简单的一种是[0-9][A-Z]{3}[0-9]{3}
也可以有其他一些格式,您可以为每种格式编写正则表达式。车牌上的附加信息不是那种会导致任何错误检测的信息。

为了测试您的正则表达式,您可以使用regex101 我测试了您的示例,这些就是结果。
在此处输入图像描述


推荐阅读