python - 我正在寻找为阿拉伯语创建 OCR。我该如何开始?
问题描述
标题差不多。使用 NLP,我想要一些可以从图像中提取文本的东西。我是新手,不知道从哪里开始以及如何去做。帮助将不胜感激。
解决方案
你想创建它还是使用已知的 API?有两个众所周知的选项,Google vision 或 tesseract。在 tesseract 中,阿拉伯语的标志是 'ara' -> https://raw.githubusercontent.com/tesseract-ocr/tessdata_best/master/ara.traineddata。在 Google 的愿景中是 languageHints = 'ar'
推荐阅读
- android-source - Do Android init property triggers always happen on boot and if so when exactly?
- matlab - 优化的多数据曲线拟合
- abap - 从惯用的结构化表格中修改某些 BSEG 字段
- terraform - 从 Terraform Map 获取列表的长度
- node.js - 在启用 https 的服务器上阻止 Facebook 不安全登录
- arm - STM32F767ZI 与 DAC082S085 接口
- java - Java应用程序中的无限while循环
- packaging - 可选手册?还是在分发中预编译?
- swift - 仅具有类型功能的结构和仅具有类型功能的类之间有什么区别?
- javascript - 根据元素 ID 从数据部分获取值