c# - 将 PDF 中的外部链接转换为 iTextSharp 中嵌入附件的链接
问题描述
我有一个奇怪的任务。我们即将关闭一个相当大的内部解决方案,并希望一次性导出它所拥有的数据。
该解决方案生成 PDF 格式的报告。这些 PDF 主要包含文本,但也包含图像。图像是链接,激活后会打开浏览器并指向图像的全尺寸版本。
由于我们即将关闭底层系统,因此指向全尺寸图像的外部链接也将停止工作。
由于各种奇怪的原因,我们对报告生成本身的控制有限,因此我们主要限于对报告进行后处理。
到目前为止,我设计的计划是从系统生成所有必要的报告并通过 iTextSharp 处理它们。我想要实现的“全部”是处理每个 PDF 并且:
- 搜索外部链接
- 下载链接指向的全尺寸图像并将其作为嵌入文件附加到 PDF
- 删除原来的外部链接,替换为相关嵌入资源的链接
我不熟悉 PDF 的底层结构,所以在尝试使用 iTextSharp 时遇到了很多困难。但是,到目前为止,我已经设法将 (1) 和 (2) 整理出来。但我正在努力解决(3):
我主要将此作为我的支持文件,但我还没有完全达到我的目标。
这是我处理每个注释的代码。作为说明,我正在使用 iTextSharp 5.5.13 版:
if (AnnotationDictionary.Get(PdfName.A) != null)
{
var annotActionObject = AnnotationDictionary.Get(PdfName.A);
var AnnotationAction = (PdfDictionary)(annotActionObject.IsIndirect() ? PdfReader.GetPdfObject(annotActionObject) : annotActionObject);
var type = AnnotationAction.Get(PdfName.S);
//Test if it is a URI action
if (type.Equals(PdfName.URI))
{
//Attach the downloaded file
PdfFileSpecification pfs = PdfFileSpecification.FileEmbedded(writer, embFile.Path, embFile.Description, null);
pfs.AddDescription(embFile.Description, false);
writer.AddFileAttachment(pfs);
//Removing old annotation
AnnotationAction.Remove(PdfName.A);
AnnotationDictionary.Remove(PdfName.A);
PdfDestination destination = new PdfDestination(PdfDestination.FIT);
destination.AddFirst(new PdfNumber(1));
var target = new PdfTargetDictionary(true);
target.EmbeddedFileName = embFile.Name;
PdfAction action = PdfAction.GotoEmbedded(null, target, destination, true);
AnnotationDictionary.Put(PdfName.D, action.Get(PdfName.D));
AnnotationAction.Put(PdfName.D, action.Get(PdfName.D));
}
}
对于某些人来说,这很可能很明显,为什么它不起作用:)
现在,一切都运行得很好,它在另一端输出了一个 PDF。如前所述,PDF 中的图像不再具有活动链接,并且所有附件都按预期嵌入。但是,嵌入式资源的链接不起作用,并且在任何地方都没有任何指示。
非常感谢所有反馈。谢谢你。
解决方案
如评论中所述,您只能链接到嵌入的 PDF 文件。
您只是更改D
条目。您需要覆盖整个A
条目,但请确保保留目标的位置。
这是我创建的一个快速 POC:
PdfReader reader = new PdfReader(INPUT_FILE);
PdfStamper stamper = new PdfStamper(reader, new FileOutputStream(OUTPUT_FILE));
PdfFileSpecification fs = PdfFileSpecification.fileEmbedded(stamper.getWriter(), null, "EmbeddedFile.pdf", FileUtils.readFileToByteArray(new File(INPUT_FOLDER + "embeddedfile.pdf")));
fs.addDescription("specificname", false);
stamper.getWriter().addFileAttachment(fs);
PdfTargetDictionary targetDictionary = new PdfTargetDictionary(true);
targetDictionary.setEmbeddedFileName("specificname");
PdfDestination dest = new PdfDestination(PdfDestination.FIT);
dest.addFirst(new PdfNumber(1));
PdfAction action = PdfAction.gotoEmbedded(null, targetDictionary, dest, true);
PdfDictionary page = reader.getPageN(1);
PdfArray annotations = page.getAsArray(PdfName.ANNOTS);
for(int x=0;x<annotations.size();x++) {
PdfDictionary annotation = annotations.getAsDict(x);
PdfArray location = annotation.getAsArray(PdfName.RECT);
action.put(PdfName.RECT,location);
annotation.put(PdfName.A, action);
}
stamper.close();
INPUT_FILE
指向原始文件,OUTPUT_FILE
指向您希望保存它的位置,并INPUT_FOLDER + "embeddedFile.pdf"
指向您希望注释链接到的 PDF 文件。
action
指向嵌入式 PDF 文件(并且只有PDF 文件)的新操作也是如此。我们只需将旧注释的A
条目替换为action
. 然后我们确保将action
' 位置设置为旧注释的位置。
推荐阅读
- c# - C# Int 数组返回等于目标的求和成员的索引
- javascript - 等待 useEffect 完成,然后访问对象属性
- python - 在 seaborn 图下方添加一个表格
- php - 如何在 Laravel 7 中使用固定选项填充多选
- django-rest-framework - {“详细信息”:“未找到。” }
- vagrant - Nifi:无法从 './data/flow.xml.gz.new.xml.gz' 重命名为 './data/flow.xml.gz'
- r - R包“robCompositions”安装问题
- docker - Docker Swarm - 请求无法到达不同节点上的服务
- postgresql - 月间隔 Postgres
- c++ - Aws C++ SDK 最小安装