首页 > 解决方案 > 如何将所有内容从 PDF 页面复制到 PDF 页面?

问题描述

我有几个 PDF 页面大小奇数,略小于 8.5x11。这些页面需要为 8.5x11,内容居中且不调整大小。这可以通过在 8.5x11 纸张上以实际尺寸和设置为自动的方向打印页面来实现,然后重新扫描打印的页面,但是浪费时间和纸张并且可能会降低质量。经过大量谷歌搜索和搜索https://api.itextpdf.com/,我在 C# 中使用 iText 7.1.14 提出了这个:

public void FixSize() // method in PDFentry class
{
    // FQFName is the string property Fully Qualified File Name
    PdfDocument srceDoc = new PdfDocument(new PdfReader(FQFName));
    int pageCount = srceDoc.GetNumberOfPages();
    string tempFile = Path.GetTempFileName();
    PdfDocument destDoc = new PdfDocument(new PdfWriter(tempFile));
    iText.Kernel.Geom.PageSize newPageSize = iText.Kernel.Geom.PageSize.LETTER;
    // this is in a try/catch, removed here for brevity
    for (int page = 1; page <= pageCount; page++)
    {
        PdfPage srcPage = srceDoc.GetPage(page);
        PdfPage dstPage = destDoc.AddNewPage(newPageSize);
        PageXObject pageXObject = srcPage.CopyAsFormXObject(destDoc);
        PdfCanvas pdfCanvas = new PdfCanvas(dstPage);
        // 18 is temporary to be replaced with a variable parameter
        pdfCanvas.AddXObjectAt(pageXObject, 18, 18);
        pdfCanvas.Release();
    }
    srceDoc.Close();
    destDoc.Close();
    File.Copy(tempFile, FQFName, true);
    File.Delete(tempFile);
}

就页面的基本内容而言,它可以工作,但它会丢失书签和可能的评论(我没有带有评论的 PDF)。事实上,就好像页面被打印并重新扫描一样,所以我想要小心你的要求,但我会怎么做才能从页面复制所有内容,基本上是复制源 PDF,只是在更大的页面上?

无论如何,PDF 将永远不会包含实时表单、作品集、带有附件的 PDF 或带有音频或视频的 PDF。它们将始终是从纸张扫描或从应用程序“打印”的 PDF。

标签: c#pdfitextitext7

解决方案


正如@KJ 已经在评论中暗示的那样,如果想要更改文档的某些细节但保留所有内容,则不应尝试逐页复制 PDF 并希望一切保持不变,更不用说从原始文件创建表单 XObjects页面并将它们添加到更加有损的新页面。

在 iText 中,您应该改为在冲压模式下处理 PDF ,即PdfDocument基于 aPdfReader和创建 a PdfWriter,并且仅应用所需的更改。

在手头的情况下,可以这样做(iText 7.2.0):

float resultWidth = 8.5f * 72;
float resultHeight = 11f * 72;

using (PdfDocument pdfDocument = new PdfDocument(new PdfReader(INFILE), new PdfWriter(OUTFILE)))
{
    for (int i = 1; i <= pdfDocument.GetNumberOfPages(); i++)
    {
        var page = pdfDocument.GetPage(i);
        var cropBox = page.GetCropBox();
        var newCropBox = new Rectangle(cropBox.GetLeft() - (resultWidth - cropBox.GetWidth()) / 2,
            cropBox.GetBottom() - (resultHeight - cropBox.GetHeight()) / 2, resultWidth, resultHeight);
        var mediaBox = page.GetMediaBox();
        var newMediaBox = Rectangle.GetCommonRectangle(mediaBox, newCropBox);
        page.SetMediaBox(newMediaBox);
        page.SetCropBox(newCropBox);
    }
}

ResizePages测试ResizeForRobertSF

在冲压模式下,我们在这里检查原始 PDF 每一页的裁剪框和媒体框,将前者的大小调整为 8.5"×11",并确保媒体框包含更新的裁剪框。


推荐阅读