c# - 使用 C# 读取 PDF 表格内容
问题描述
我正在使用iTextSharp阅读 PDF 内容,但是当我尝试使用此库阅读表格时,我的数据没有很好地排序!您能否建议我另一个库或帮助我修改代码!
public static string pdfText(string path)
{
PdfReader reader = new PdfReader(path);
string text = string.Empty;
for (int page = 1; page <= 2; page++)
{
text += PdfTextExtractor.GetTextFromPage(reader, page);
}
var textWithoutEmptyLines = Regex.Replace(text, @"^\s+$[\r\n]*", string.Empty, RegexOptions.Multiline);
reader.Close();
return textWithoutEmptyLines;
}
解决方案
推荐阅读
- java - 从另一个类访问 hashmap 值
- javascript - 将具有索引的数组展平为具有类型的对象
- firebase - 如何通过颤振搜索我的firestore数据库中的多个字段
- ajax - 使用 Spring Boot 和 Java 脚本从应用程序下载压缩的父文件夹时出错
- powershell - linux PowerShell 中“nohup”的等价物是什么?
- jquery - 如何实现 setInterval 每秒更新一个时钟?
- blazor - 如何使用 abp.io 在 ui 中显示 ExtraProperties
- java - Java的基本递归
- c - 通过管道的进程间通信发送结构
- javascript - 使用 fetch 更改 JSON 值