首页 > 解决方案 > OpenPDF/iText 损坏的文档

问题描述

我一直在尝试在 Scala 中重新实现 OpenPDF 1.2.4 和 1.2.11 中的连接示例:

def mergePdfs(docs: Seq[Array[Byte]]): Array[Byte] = {
    log.debug(s"merging ${docs.size} PDFs")
    val output = new ByteArrayOutputStream()
    val document = new Document()
    val copy = new PdfCopy(document, output)
    getPageSize(docs.headOption) foreach document.setPageSize
    document.open()
    docs foreach { doc =>
      val reader = new PdfReader(doc)
      1 to reader.getNumberOfPages foreach { pageNum =>
        copy.addPage(copy.getImportedPage(reader, pageNum))
      }
    }
    document.close()
    output.toByteArray
  }

是一个示例输出文档我从 this 的两个副本和this的三个副本生成它

我看到两个问题:

- 文档已损坏(仅在 FireFox 中打开),部分原因是标题和第一个对象之间有一条线。删除有问题的行并不能修复客户端代码中的文档错误,谢谢@mkl!

$ strings out.pdf | grep "A Simple PDF File" | wc -l | tr -d ' '
6

在一种情况下,我使用 vim 删除了第一个内容流,这导致文本出现在第一页上。

我是否以某种方式滥用 API?

标签: scalaitextopenpdf

解决方案


结果文件的前 17465 个字节是代码的实际结果(“两个副本,然后三个副本”)。31181 字节文件的剩余字节由其他 PDF 的片段组成。

在评论中,您说您正在“使用生成的字节数组调用 Files.write”。你用的是哪个OpenOptions?可能CREATE但不是TRUNCATE_EXISTING


推荐阅读