python - 运行 OCR Python
问题描述
我正在尝试用 Python 制作一些 OCR。我在互联网上找到了这段代码,它做了我想做的事。但是当我尝试运行它时,我会收到此错误消息。
将我的代码留在这里:
import io
from PIL import Image
import pytesseract
from wand.image import Image as wi
pdf = wi(filename="test1(citibank).pdf", resolution=300)
pdfImage = pdf.convert('jpeg')
imageBlobs = []
for img in pdfImage.sequence:
imgPage=wi(image=img)
imageBlobs.append(imgPage.make_blob('jpeg'))
recognisedtext = []
for imgBlob in imageBlobs:
im = Image.open(io.BytesIO(imgBlob))
text = pytesseract.image_to_string(im, lang='es')
recognisedtext.append(text)
print(recognisedtext[1])
解决方案
推荐阅读
- r - 扰乱图交叉点数的问题
- linux - 在可执行文件中嵌入版本信息并从 Linux 核心转储中检索它?
- c# - 为 JWT 的 AsymmetricSecurityKey 交换 SymmetricSecurityKey
- javascript - 压缩多个 PDF 并下载 zip 文件?
- javascript - Chrome Devtools 时间轴中资产的不同颜色深浅意味着什么?
- javascript - 尝试创建 javascript 以用破折号分隔 +1 10 位全球数字
- reactjs - 反应组件子不渲染
- winapi - x86 程序集中的 MessageBox 程序
- python - 如何在 xlsxwriter 中填充一块单元格?
- bash - 输出字段分隔符不一致