首页 > 解决方案 > 正方体选项和图像预处理

问题描述

我尝试 OCR 的图像

编辑:如要求,这是原始图像

亲爱的社区,我正在尝试做一些 ocr。
我已经对图像进行了很多预处理(未倾斜,裁剪......)
现在,我可以毫无问题地自己读取数字
但我无法获得 tesseract 给我一个有意义的结果。

单击顶部的链接以查看我正在尝试 OCR 的图像

我还缺少更多的预处理吗?
还是我把 tesseract 称为不好?

我根本没有选择,或者没有选择:

config = ('--psm 13 -c tessedit_char_whitelist=0123456789')

编辑 :

有趣的是,我尝试了多种方法:

所以这对我来说是非常开始的。我可能更喜欢使用 Tesseract,以免花大价钱。当我的项目更高级时,我会知道我能做什么。

但我很想听听您对图像预处理的建议!:-)

所以如果你有建议。

问候 !

标签: pythonjupyter-notebookocrtesseractimage-preprocessing

解决方案


您可以为 tesseract 提供三个重要标志,它们是-l--oem--psm

  • -l 标志控制输入文本的语言。

  • 参数或 OCR 引擎模式控制 Tesseract 使用的--oem 算法类型。

  • --psm 控制 Tesseract 使用的自动页面分割模式。

获取选项使用:

像这样使用这些选项config = ("-l eng --oem 1 --psm 7")


推荐阅读