首页 > 解决方案 > 我可以在不使用 Selenium 或其他 C# 库的本地计算机上下载 Pdf 文件的情况下阅读它吗

问题描述

我想读取字符串或流对象中的 pdf 数据,而无需通过某些 C# 库将其下载到本地计算机上。目前我正在从事一个自动化项目,我正在使用 Selenium-chromewebdriver 请建议一个 C# 库,我可以从中完成这项任务。

标签: c#seleniumpdfautomationselenium-chromedriver

解决方案


为了在您的项目中使用此解决方案,您需要执行以下步骤:

添加对 itextsharp.dll 和 SharpZiplib.dll 的引用 将
PDFParser.cs 类添加到您的项目中

然后可以通过以下方式使用新添加的类:

// create an instance of the pdfparser class
PDFParser pdfParser = new PDFParser();

// extract the text
String result = pdfParser.ExtractText(pdfFile);

使用 iTextSharp 的 PdfReader 类来提取每个页面的缩小内容,我使用一个简单的函数 ExtractTextFromPDFBytes 来从缩小页面中提取文本内容。


推荐阅读