image-processing - 偏斜旋转的文档图像
问题描述
我有护照 ID 的 OCR 数据集。图像可以在数据集中随机旋转(任意角度)。
歪斜图像的最佳方法是什么(这应该有助于网络更准确地检测字符)?
最简单的方法是为此训练 NN,但我敢肯定,应该有任何经典的计算机视觉方法来完成这项任务。
解决方案
如今,护照ID已标准化。
尝试定位具有字符大小的暗特征并按几何距离对它们进行聚类(一个很好的技巧是计算最小生成树,但这有点技术性)。
从字符邻域关系图中,您应该能够识别主导方向并重建字符串。
我知道没有现成的解决方案可以实现这一点。
推荐阅读
- macos - 使用 Applescript 控制 Finder 的窗口“标签栏”可见性?
- c# - 如何检查 UWP App 是否在模拟器中运行?
- php - 基于数据库表中的第一个下拉列表填充第二个下拉列表而不使用 javascript
- scala - 我们必须在 Spark 中使用哪种编码/字符集?
- c# - 在最简单的情况下,ODBC DataReader 在数据正确时无法获取布尔值
- wpf - WPF ListBoxItem 事件从未被调用
- sql - 对单个问题的跨表查询
- restlet - restlet 1.0 中的自定义身份验证
- r - 在r中加载多个excel文件时出错
- database-design - 使用报告系统作为仓库/集市的源数据