c# - 如何将所有内容从 PDF 页面复制到 PDF 页面?
问题描述
我有几个 PDF 页面大小奇数,略小于 8.5x11。这些页面需要为 8.5x11,内容居中且不调整大小。这可以通过在 8.5x11 纸张上以实际尺寸和设置为自动的方向打印页面来实现,然后重新扫描打印的页面,但是浪费时间和纸张并且可能会降低质量。经过大量谷歌搜索和搜索https://api.itextpdf.com/,我在 C# 中使用 iText 7.1.14 提出了这个:
public void FixSize() // method in PDFentry class
{
// FQFName is the string property Fully Qualified File Name
PdfDocument srceDoc = new PdfDocument(new PdfReader(FQFName));
int pageCount = srceDoc.GetNumberOfPages();
string tempFile = Path.GetTempFileName();
PdfDocument destDoc = new PdfDocument(new PdfWriter(tempFile));
iText.Kernel.Geom.PageSize newPageSize = iText.Kernel.Geom.PageSize.LETTER;
// this is in a try/catch, removed here for brevity
for (int page = 1; page <= pageCount; page++)
{
PdfPage srcPage = srceDoc.GetPage(page);
PdfPage dstPage = destDoc.AddNewPage(newPageSize);
PageXObject pageXObject = srcPage.CopyAsFormXObject(destDoc);
PdfCanvas pdfCanvas = new PdfCanvas(dstPage);
// 18 is temporary to be replaced with a variable parameter
pdfCanvas.AddXObjectAt(pageXObject, 18, 18);
pdfCanvas.Release();
}
srceDoc.Close();
destDoc.Close();
File.Copy(tempFile, FQFName, true);
File.Delete(tempFile);
}
就页面的基本内容而言,它可以工作,但它会丢失书签和可能的评论(我没有带有评论的 PDF)。事实上,就好像页面被打印并重新扫描一样,所以我想要小心你的要求,但我会怎么做才能从页面复制所有内容,基本上是复制源 PDF,只是在更大的页面上?
无论如何,PDF 将永远不会包含实时表单、作品集、带有附件的 PDF 或带有音频或视频的 PDF。它们将始终是从纸张扫描或从应用程序“打印”的 PDF。
解决方案
正如@KJ 已经在评论中暗示的那样,如果想要更改文档的某些细节但保留所有内容,则不应尝试逐页复制 PDF 并希望一切保持不变,更不用说从原始文件创建表单 XObjects页面并将它们添加到更加有损的新页面。
在 iText 中,您应该改为在冲压模式下处理 PDF ,即PdfDocument
基于 aPdfReader
和创建 a PdfWriter
,并且仅应用所需的更改。
在手头的情况下,可以这样做(iText 7.2.0):
float resultWidth = 8.5f * 72;
float resultHeight = 11f * 72;
using (PdfDocument pdfDocument = new PdfDocument(new PdfReader(INFILE), new PdfWriter(OUTFILE)))
{
for (int i = 1; i <= pdfDocument.GetNumberOfPages(); i++)
{
var page = pdfDocument.GetPage(i);
var cropBox = page.GetCropBox();
var newCropBox = new Rectangle(cropBox.GetLeft() - (resultWidth - cropBox.GetWidth()) / 2,
cropBox.GetBottom() - (resultHeight - cropBox.GetHeight()) / 2, resultWidth, resultHeight);
var mediaBox = page.GetMediaBox();
var newMediaBox = Rectangle.GetCommonRectangle(mediaBox, newCropBox);
page.SetMediaBox(newMediaBox);
page.SetCropBox(newCropBox);
}
}
(ResizePages测试ResizeForRobertSF
)
在冲压模式下,我们在这里检查原始 PDF 每一页的裁剪框和媒体框,将前者的大小调整为 8.5"×11",并确保媒体框包含更新的裁剪框。
推荐阅读
- java - Java如何访问文本字段
- css - CSS:元素具有“显示:块”并且不开始新行
- angular - Angular Service Worker - 在 dist/styles.*.css 上 PurifyCSS 之后的哈希不匹配
- postgresql - 如何选择具有不同条件的同一列
- html - 添加了一个全局宽度我希望一个特定元素超过该宽度限制
- php - 在 Laravel 5.8 中检查日期
- python - Elasticsearch 无请求模糊查询
- java - 用于多个主题的 Spring WebSockets
- php - 可以使用 php/html 编写的应用程序页面将文件上传到 GCP 上的计算引擎吗?
- python - 将excel中的左列与右列与python和pandas进行比较