computer-vision - 面对本次识别案例推荐OCR软件
问题描述
我必须识别这样的图片中的文字:
我试过 Tesseract,但我对结果不是很满意。
您能否向我推荐任何可以在“图像上的文本识别”而不是“文档上的文本识别”中更准确的软件?
提前致谢
解决方案
不要指望 Tesseract 开箱即用。此图像在放入 Tesseract 之前需要一些工作。
我会做以下预处理:
- 模糊图像以消除一些数字噪声
- 具有合适参数的自适应阈值
- 正确的图像颜色以提供白色背景和黑色文本
- 这应该是简单的操作,如有必要只需反转颜色
- 使用正确的语言文件运行 Tesseract(我猜是意大利语?)
这些预处理步骤真的很容易手动编程,但是当然有很多具有这种功能的库。
推荐阅读
- node.js - MongoDB无法在NodeJS的另一个文件中获取集合
- python - 为什么添加图例后我的 python 绘图代码运行如此缓慢?
- python - 分割算法
- python - Smtplib 在 python3 中给出错误。不明白为什么
- javascript - 在 ReactJs 中持续观察条件是否为真而不渲染
- rust - fn 项和 fn 指针之间的实际区别是什么?
- prisma - 如何使用 Prisma 过滤没有相关记录的记录?
- php - 当数组是普通数组和嵌套数组的混合时,显示数组中的所有数据
- python - Popen 获取 TypeError:预期的 str、字节或 os.PathLike 对象,而不是 linux 上的元组
- python - 如果列名匹配,则将数据框列值更改为行