首页 > 解决方案 > ABBYY OCR 无法识别 FRENCH 字符

问题描述

我刚开始在 C# 环境中使用 ABBYY FineReader 引擎。我正面临一些法语 pdf 文档的识别问题。重音字符无法识别,有些单词似乎不尊重字典检查......这是我的代码:

loader = new FREngine.InprocLoader();
engine = loader.InitializeEngine("XXXXXXXXXXXXXXXXXX");

IRecognizerParams rp = engine.CreateRecognizerParams();
rp.SetPredefinedTextLanguage("French");

document = engine.CreateFRDocumentFromImage(@"D:\test.pdf");

document.Process();

document.Export(@"D:\test.docx", FREngine.FileExportFormatEnum.FEF_DOCX, null);

我怀疑用于识别的语言的法语配置被忽略了。您有任何想法如何以正确的方式设置它吗?

标签: c#ocrabbyy

解决方案


它更适用于:

document = engine.CreateFRDocumentFromImage(@"D:\test.pdf");

DocumentProcessingParams dpp = engine.CreateDocumentProcessingParams();
dpp.PageProcessingParams.RecognizerParams.SetPredefinedTextLanguage("French");

document.Process(dpp);

似乎可以识别法语单词和重音字符。虽然结果不如 ABBYY 云解决方案...


推荐阅读