首页 > 解决方案 > 使用 C# 读取 PDF 表格内容

问题描述

我正在使用iTextSharp阅读 PDF 内容,但是当我尝试使用此库阅读表格时,我的数据没有很好地排序!您能否建议我另一个库或帮助我修改代码!

public static string pdfText(string path)
{
    PdfReader reader = new PdfReader(path);
    string text = string.Empty;
    for (int page = 1; page <= 2; page++)
    {
        text += PdfTextExtractor.GetTextFromPage(reader, page);
    }
    var textWithoutEmptyLines = Regex.Replace(text, @"^\s+$[\r\n]*", string.Empty, RegexOptions.Multiline);
    reader.Close();
    return textWithoutEmptyLines;
}

标签: c#pdfitext

解决方案


推荐阅读