首页 > 解决方案 > 偏斜旋转的文档图像

问题描述

我有护照 ID 的 OCR 数据集。图像可以在数据集中随机旋转(任意角度)。

歪斜图像的最佳方法是什么(这应该有助于网络更准确地检测字符)?

最简单的方法是为此训练 NN,但我敢肯定,应该有任何经典的计算机视觉方法来完成这项任务。

标签: image-processingdeep-learningcomputer-vision

解决方案


如今,护照ID已标准化。

尝试定位具有字符大小的暗特征并按几何距离对它们进行聚类(一个很好的技巧是计算最小生成树,但这有点技术性)。

从字符邻域关系图中,您应该能够识别主导方向并重建字符串。

我知道没有现成的解决方案可以实现这一点。


推荐阅读