cycle - 从多个图像中提取文本
问题描述
我想从几个图像中提取文本。
我想在colab中做。
我知道如何用一张图片做到这一点:https
://github.com/bhadreshpsavani/ExploringOCR/blob/master/OCRusingTesseract.ipynb
但是如何在一个循环中做到这一点,因为我有一百多张图片?
提前致谢!
解决方案
我在根目录的 colab.research 中上传了我的图像,并使用以下代码解决了此任务:
image_ext = ['.jpg', '.png', '.jpeg']
directory = '/'
for file in os.listdir(directory):
ext = os.path.splitext(file)[-1].lower()
if ext not in image_ext:
continue
filename = os.path.join(directory, file)
extracted_information = pytesseract.image_to_string(Image.open(filename))
print(extracted_information)
推荐阅读
- cleverhans - 使用 Cleverhans 在 Keras 中实现 FGSM 时出错
- android - Facebook Audience Network 质量检查总是失败
- wordpress - 警告:mysqli_escape_string() 只需要 2 个参数
- django-oscar - RuntimeError:在应用程序“目录”中冲突“product_product_options”模型:在 Oscar 2
- javascript - 如何在 Express [MEAN] 中发送标头
- django - 模拟 Django 用户的最佳方法是什么?
- c++11 - 将 shared_ptr 作为参数传递给线程函数,会导致错误
- docker - Flask 代码单独运行,但使用 docker 容器化时,页面无法访问
- iphone - 自 IOS 13 更新以来在 Visual Studio Code 中调试 Flutter 不起作用
- java - RestTemplate 获取对象列表 - 为什么使用 ParameterizedTypeReference 而不是对象数组?