首页 > 解决方案 > C# 应用程序在 OCR 完成后不读取 txt 文件,无论内容如何

问题描述

我用 C# 制作了一个应用程序,您在其中放置一个 PDF 文件,将其转换为 PNG,然后将 PNG 裁剪为几个部分,然后对这些部分执行 OCR,并在 TXT 文件上进行写入。到目前为止,一切都很好。我遇到的问题是当我尝试读取那些基于 txt-on-OCR 的文件时:没有读取。有时它会读取所有文件,有时则不会(实际上没有文件)。以下是我为读取这些文件而编写的代码:

var reader = new StreamReader(StoreTextFilePath2);
string direcc = reader.ReadToEnd().ToString();
var reader3 = new StreamReader(StoreTextFilePath3);
string npoliza = reader3.ReadToEnd().ToString();
var reader4 = new StreamReader(StoreTextFilePath4);
string inixo = reader4.ReadToEnd().ToString().Replace("-", "/").Replace(" ", "");
var reader5 = new StreamReader(StoreTextFilePath5);
string finxo = reader5.ReadToEnd().ToString().Replace("-", "/").Replace(" ", "");
var reader6 = new StreamReader(StoreTextFilePath6);
string seccc = reader6.ReadToEnd().ToString();
var reader7 = new StreamReader(StoreTextFilePath7);
string phono = reader7.ReadToEnd().ToString();
var reader8 = new StreamReader(StoreTextFilePath8);
string nyaaa = reader8.ReadToEnd().ToString();
var reader9 = new StreamReader(StoreTextFilePath9);
string dniii = reader9.ReadToEnd().ToString();
var reader10 = new StreamReader(StoreTextFilePath10);
string antep = reader10.ReadToEnd().ToString();

如您所见,这些字符串应该获取那些 TXT 的读数,但无论 TXT 内容如何,​​它们都保持为空。难道我做错了什么?由于 PNG 和 TXT 是有效的,并且实际上包含有效文本(不是可能是错误/不正确 OCR 导致的无效字符)。

提前感谢任何可以帮助我的人。

PS:为StreamReader指定的“StoreTextFilePath”是不同的TXT文件,首先通过OCR获得PNG的文本。

标签: c#ocrtxt

解决方案


你为什么不尝试阅读 txt 文件File.ReadAllText(FilePath);
像这样容易得多。
并确保 Txt 文件的内容不为空。


推荐阅读