python - 正方体选项和图像预处理
问题描述
亲爱的社区,我正在尝试做一些 ocr。
我已经对图像进行了很多预处理(未倾斜,裁剪......)
现在,我可以毫无问题地自己读取数字
但我无法获得 tesseract 给我一个有意义的结果。
单击顶部的链接以查看我正在尝试 OCR 的图像
我还缺少更多的预处理吗?
还是我把 tesseract 称为不好?
我根本没有选择,或者没有选择:
config = ('--psm 13 -c tessedit_char_whitelist=0123456789')
编辑 :
有趣的是,我尝试了多种方法:
- Windows 上的 Tesseract 5,不提供任何“eT” (但可能配置错误)
- Windows 上 Phyton Jupyter Notebook 的 Google API => 'UO0 1124'或类似的东西不太记得了
- buntu 上的 Tesseract 4 配置 = ('-l eng --oem 1 --psm 13') : 'WU000 244m'
- 来自 Ubuntu 上 Python Jpyter Notebook 的 Google API => 'U000241\n'
所以这对我来说是非常开始的。我可能更喜欢使用 Tesseract,以免花大价钱。当我的项目更高级时,我会知道我能做什么。
但我很想听听您对图像预处理的建议!:-)
所以如果你有建议。
问候 !
解决方案
您可以为 tesseract 提供三个重要标志,它们是-l
、--oem
和--psm
。
该
-l
标志控制输入文本的语言。参数或 OCR 引擎模式控制 Tesseract 使用的
--oem
算法类型。--psm
控制 Tesseract 使用的自动页面分割模式。
获取选项使用:
tesseract --help-oem
为 OEM。tesseract --help-psm
为psm。https://github.com/tesseract-ocr/tesseract/wiki/Data-Files获取语言代码:
像这样使用这些选项config = ("-l eng --oem 1 --psm 7")
推荐阅读
- jquery - 在 css 中摇一摇在 jquery 中仅持续 5 秒
- firebase - 新的 firebase 项目没有出现在 shell 上
- javascript - VSCode:从 JS url(查看 url)到 Django 视图的“转到定义”
- java - 如何使用相同的 dao 访问指向不同集合的不同存储库?
- python - 安装 Azure IoT Python SDK 的问题
- reactjs - 想要传递项目 ID 代替项目名称
- mysql - MySQL 存储过程遍历 2 个表,选择值并存储在第 3 个表中
- node.js - aws sdk nodejs:检查是否有用户在线
- c# - 如何使用asp.net 将焦点集中到gridview 上?
- php - PHP 按列对 SQL 结果进行分组