首页 > 解决方案 > Tesseract.js 不适用于阿拉伯语?

问题描述

我正在使用带有 nodeJs 的 tesseract.js 来识别图像中的阿拉伯文本,但不幸的是,它给了我一个不符合输入图像文本的文本。

输入: 1

输出: 2

var tesseract = require('tesseract.js')
var request = require('request')
var fs = require('fs')
var util = require('util');
var path = 'C:/Users/Lenovo/Desktop/projet'
var log_file = fs.createWriteStream(path + '/arab.txt', {flags : 'w'});
var log_stdout = process.stdout;
var filename = 'capture.PNG'
tesseract.create({ langPath: "ara.cube.fold"  })
       .recognize(filename, 'ara')
       .progress(function  (p) { console.log('progress', p)  })
       .catch(err => console.error(err))
       .then(function (result) {
    console.log = function(result) {
      log_file.write(util.format(result) + '\n');
      log_stdout.write(util.format(result) + '\n');
     };
    console.log(result.text)
    process.exit(0)
})

请问有什么解决办法!!

标签: node.jsocrtesseractarabic

解决方案


推荐阅读