python-3.x - Tesseract 开源 OCR 引擎 v3.05.00dev,在 pixReadMemPng 中带有 Leptonica 警告
问题描述
我正在尝试使用 pytesseract 将 PNG 图像文件转换为文本。它给了我以下错误。
TesseractError:(1,'Tesseract Open Source OCR Engine v3.05.00dev with Leptonica 警告在 pixReadMemPng:解决方法:写入临时文件 libpng 警告:使用 libpng-1.4.3 构建的应用程序但以 1.5.14 运行 pixReadStreamPng 中的错误: png_ptr not made pixReadMemPng 中的错误: pix not read pixReadMem 中的错误: png: no pix returned 处理期间错误。')
当我做 tesseract -v
tesseract 3.05.00dev leptonica
-1.72
libjpeg 9:libpng 1.5.14:libtiff 4.0.3:zlib 1.2.5:libopenjp2 2.1.0
解决方案
我也遇到这个问题,网上找不到答案。
但我尝试下载tesseract-ocr并安装它,然后:
- 设置环境变量,
TESSDATA_PREFIX:"C:\Program Files (x86)\Tesseract-OCR\tessdata"
- 添加
C:\Program Files (x86)\Tesseract-OCR
到路径变量。 - 在第 35 行编辑
pytesseract.py
,tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
当我pytesseract.image_to_string(img)
在 anaconda 提示符中调用时,它返回一个字符串。我的环境:</p>
- pytesseract 0.2.6
- 枕头 5.2.0
- 正方体 4.00.00alpha
推荐阅读
- c# - XML 到 CSV 的转换,如 MS Excel
- spring - 如何在具有相同代码库的特定服务器中运行计划任务
- python - 如何向concurrent.futures ThreadPool executor提交任务并立即返回回复
- java - 如何从 java 程序本身更改域的 IP 地址?
- python - 平均观看 Facebook 分钟数指标
- jolt - 带有数组值的 Jolt Transformation Spec
- c# - Webapis 中的静态类
- javascript - 如何使用在 .then() 之外的 .then() 中设置的 var 的值?
- .net - NSwag Post Build swagger.json 生成失败
- php - Docker Elastic Search - 如何在 windows docker 中设置 vm.max_map_count?