首页 > 解决方案 > Bad tesseract 截图识别结果

问题描述

我正在尝试对从其他程序捕获的文本进行 PyTesseract 识别。结果出人意料地糟糕。我认为这是一个简单的问题,因为 20 多年前扫描的文档识别已经相当不错了。

例如,在此处输入图像描述我得到

"win32¢gui.EnumWindows(enum_cb, toplist)

winInfos = [(hwnd, title) for hwnd, title in winlist if
print("™sd process(es) found" % Len(winInfos))

wininfo = winInfos[@]

hwnd = wininfo[@]

# w2 = win32gui.Findwindow(None, “"Chrome")

for i in range(10):

 
eel eee"

如果没有缩放以及不同的背景和文本颜色,情况会更糟。

我不需要完美的解决方案(这是相当实验性的项目),但至少需要一些足够的东西。我对如何实现/解决这个问题的方法没有太多限制。仅限于 Windows 和 Python 也是非常可取的。我或多或少地了解 Python,并且在整个编程方面经验丰富,但在文本识别方面是新手。

Tesseract 是我尝试的第一个库。我读过它是最好的之一。我已经知道它喜欢大字体(尽管对于所有相同符号看起来总是相同的屏幕截图,我认为 8 像素高度就足够了)。并查看缩放和使所有背景和文本颜色相等的帮助,但还不够。我将识别具有不同文本颜色和背景的表格的内容,因此最好不要绊倒这些东西。

我看到的解决方法:

你能推荐什么?

谢谢

标签: pythonwindowsocrscreen-scraping

解决方案


推荐阅读