首页 > 解决方案 > OCR jpeg 文件转文本

问题描述

我正在尝试将附加的 OCR jpeg 文件转换为文本。当我使用 pytesseract 或 tesseract 时,我看到了变音符号。因为我的输出包含很多垃圾字符。并且将 jpeg 转换为文本不起作用。

我厌倦了从图像文件中读取、提取文本并使用击键进行打印。未达到预期输出的地方。代码如下:

image=Image.open('8001.jpg')
text = image_to_string(image, lang='eng')
keyboard.write(text)

我得到了一些像这样不需要的字符

) ) 7? ) 7 0 破晓:出现。Ihe mowing miosls ourvounded us, bub Urey 2001 clear ch J Wea

pm 0. 0 ) ) aeaboul lo 检查船体,它在 deely 上形成了一种水平 2

fatfoun,w fen a J 感到自己的想法,踢着响亮的盘子。“打开,

) 我” 57 渐渐下沉。哦!迷惑我!哭着点头

0 Q yi 你这个无情的 zasealy!

说 Pp iy ui

0 0 cide,来自Boal的内部。一个伊顿盘子被移动了,一个男人出现了

标签: ocrtesseractpython-tesseract

解决方案


推荐阅读