c# - ABBYY OCR 无法识别 FRENCH 字符
问题描述
我刚开始在 C# 环境中使用 ABBYY FineReader 引擎。我正面临一些法语 pdf 文档的识别问题。重音字符无法识别,有些单词似乎不尊重字典检查......这是我的代码:
loader = new FREngine.InprocLoader();
engine = loader.InitializeEngine("XXXXXXXXXXXXXXXXXX");
IRecognizerParams rp = engine.CreateRecognizerParams();
rp.SetPredefinedTextLanguage("French");
document = engine.CreateFRDocumentFromImage(@"D:\test.pdf");
document.Process();
document.Export(@"D:\test.docx", FREngine.FileExportFormatEnum.FEF_DOCX, null);
我怀疑用于识别的语言的法语配置被忽略了。您有任何想法如何以正确的方式设置它吗?
解决方案
它更适用于:
document = engine.CreateFRDocumentFromImage(@"D:\test.pdf");
DocumentProcessingParams dpp = engine.CreateDocumentProcessingParams();
dpp.PageProcessingParams.RecognizerParams.SetPredefinedTextLanguage("French");
document.Process(dpp);
似乎可以识别法语单词和重音字符。虽然结果不如 ABBYY 云解决方案...
推荐阅读
- azure - Azure Service Plan 如何对不同应用的流量进行负载平衡
- typescript - 我如何使用扩展运算符而不是扩展运算符 | 打字稿
- ios - Ipad 崩溃,appAvailability 检查whatsapp
- c# - F# 在管道运算符中使用临时变量,也就是 C# LINQ let
- java - Jenkins Job DSL 问题试图保护凭证
- azure - Powershell 脚本中的 Azure 函数连接
- python - 如何根据两个不同的目录发送命令
- phantomjs - 如何使用 Solana keygen 中的密钥来使用网络钱包?
- typescript - 检查打字稿中也可以为空的值是否大于4
- awk - 断线和空格