algorithm - 识别扫描/拍摄文档上的符号
问题描述
我正在尝试执行以下操作:
所有符号都是数字,除了最顶部字段中的第一个是字母。
问题是我尝试了 tessaract 和 google ml OCR,但结果很差,可能是因为它是单元格中的单个符号,而不是普通文本。我不知道。
所以我决定尝试我自己的简单识别模块。
a)然后我将其转换为灰度和黑白
b)不幸的是,不能保证每次都在完全相同的地方。由于扫描/照片,它们的尺寸也不相同。
所以我动态地试图找到字段的位置。但是在我收到的测试照片上,没有保证线条是直的。此外,扫描/拍摄的分辨率并不总是相同的。
如果有人可以就以下问题给我建议,那就太好了:
动态查找字段。(目前我的成功率约为 50%,具体取决于照片)
如何处理非直线。
如何检测单个单元格内容/符号。
识别单个符号/数字/的好方法(比较来源等)
也许是一个更好的黑白转换,而不是一个简单的阈值。
解决方案
推荐阅读
- python-3.x - 具有未缩放特征值的python pdpbox图
- ios - 升级 React-Native iOS 在 Xcode 中找不到“Bundle React Native Code And Images”
- vue.js - onChange 两个选择 Vuejs 上的最大标签
- nlp - 用于计算 NLP 问题中的损失的稀疏交叉熵损失。PyTorch
- angular - 在生产构建中包含库许可证 - 角度
- azure - API 管理策略 - 通过 x-www-form-urlencoded 正文
- asp.net-core - 使用 Identity Server 4 和 ASP.NET Core 滑动过期
- php - 获取数组的总和
- cloud-init - 如何使用 nocloud 数据源使用 Cloudinit 执行脚本
- php - 新创建的路由未反映到生产服务器