python - Bad tesseract 截图识别结果
问题描述
我正在尝试对从其他程序捕获的文本进行 PyTesseract 识别。结果出人意料地糟糕。我认为这是一个简单的问题,因为 20 多年前扫描的文档识别已经相当不错了。
"win32¢gui.EnumWindows(enum_cb, toplist)
winInfos = [(hwnd, title) for hwnd, title in winlist if
print("™sd process(es) found" % Len(winInfos))
wininfo = winInfos[@]
hwnd = wininfo[@]
# w2 = win32gui.Findwindow(None, “"Chrome")
for i in range(10):
eel eee"
如果没有缩放以及不同的背景和文本颜色,情况会更糟。
我不需要完美的解决方案(这是相当实验性的项目),但至少需要一些足够的东西。我对如何实现/解决这个问题的方法没有太多限制。仅限于 Windows 和 Python 也是非常可取的。我或多或少地了解 Python,并且在整个编程方面经验丰富,但在文本识别方面是新手。
Tesseract 是我尝试的第一个库。我读过它是最好的之一。我已经知道它喜欢大字体(尽管对于所有相同符号看起来总是相同的屏幕截图,我认为 8 像素高度就足够了)。并查看缩放和使所有背景和文本颜色相等的帮助,但还不够。我将识别具有不同文本颜色和背景的表格的内容,因此最好不要绊倒这些东西。
我看到的解决方法:
- 增加源程序中的字体以获得“真正的”更高分辨率(不确定这是否有足够的帮助),
- 在我的字体上训练 Tesseract(快速搜索发现这很无聊 - 包含 20 个步骤的说明或我没有的 Python 脚本),
- 尝试其他库。
你能推荐什么?
谢谢
解决方案
推荐阅读
- android - 如何防止或响应关闭 EuiccManager 的解析活动
- excel - 从电子表格/Excel 中的表值创建列表
- java - Spring Boot 2 After aspect 查找成功或失败
- c# - 游戏中的所有枪都同时射击,而我只想要我拿着的枪射击
- javascript - Joi 验证数组中的总和
- django - Django-cron 检查正在运行的进程
- python - 如何将我的数据集加载到 Pytorch 或 Keras?
- php - PHP odbc_exec 不返回所有行
- python - Python输入类型字段不显示
- python - 某些变量范围会导致不同的数组大小?