c# - 我可以在不使用 Selenium 或其他 C# 库的本地计算机上下载 Pdf 文件的情况下阅读它吗
问题描述
我想读取字符串或流对象中的 pdf 数据,而无需通过某些 C# 库将其下载到本地计算机上。目前我正在从事一个自动化项目,我正在使用 Selenium-chromewebdriver 请建议一个 C# 库,我可以从中完成这项任务。
解决方案
为了在您的项目中使用此解决方案,您需要执行以下步骤:
添加对 itextsharp.dll 和 SharpZiplib.dll 的引用 将
PDFParser.cs 类添加到您的项目中
然后可以通过以下方式使用新添加的类:
// create an instance of the pdfparser class
PDFParser pdfParser = new PDFParser();
// extract the text
String result = pdfParser.ExtractText(pdfFile);
使用 iTextSharp 的 PdfReader 类来提取每个页面的缩小内容,我使用一个简单的函数 ExtractTextFromPDFBytes 来从缩小页面中提取文本内容。
推荐阅读
- http - Jenkins 服务将 http:servername:8080 重定向到 https:servername:8080
- android - 颤动中的自定义时间轴视图
- java - Spring ExceptionHandler 但对于普通bean
- bash - 在 bash 脚本中使用模板 `file{1..n}` 获取带有 `ls` 的文件列表
- javascript - ionic 4 自定义组件动画/过渡动画
- html - 如何修复剪切路径切断包裹图像的一小部分?
- c# - Wat 是运行 .NET Core 2.1 WebApi 的最佳 Azure REDIS Stackexchange 配置和用法
- typo3 - TYPO3 Flux FAL 对象中的 YouTube id 内容
- arrays - 如何将树转换为数组?
- angular - RxJS 中的 map 与 switchMap