首页 > 解决方案 > 我正在寻找为阿拉伯语创建 OCR。我该如何开始?

问题描述

标题差不多。使用 NLP,我想要一些可以从图像中提取文本的东西。我是新手,不知道从哪里开始以及如何去做。帮助将不胜感激。

标签: pythonnlpocr

解决方案


你想创建它还是使用已知的 API?有两个众所周知的选项,Google vision 或 tesseract。在 tesseract 中,阿拉伯语的标志是 'ara' -> https://raw.githubusercontent.com/tesseract-ocr/tessdata_best/master/ara.traineddata。在 Google 的愿​​景中是 languageHints = 'ar'


推荐阅读