首页 > 解决方案 > 如何从 pdfBox 导入 ImageIOUtil 和 PDFText2HTML 类

问题描述

我正在尝试获取一个远程 pdf 文件并对其执行一些操作。为此,我使用 PDFBox。我无法使用工具包来导入 ImageIOUtil 和 PDFText2HTML

我在搜索网络后通过 Maven 依赖项添加了 pdfbox 2.0.6 我尝试将其更改为 2.0.7 和 2.0.5

我使用的位置:

导入 org.apache.pdfbox.tools.PDFText2HTML;

导入 org.apache.pdfbox.tools.imageio.ImageIOUtil;

此处的 Javadoc 中指定了哪些内容: https ://pdfbox.apache.org/docs/2.0.5/javadocs/org/apache/pdfbox/tools/imageio/ImageIOUtil.html https://pdfbox.apache.org/docs /2.0.7/javadocs/org/apache/pdfbox/tools/PDFText2HTML.html

但我得到'无法解析符号“工具”'

我的pom:

<dependency>
  <groupId>org.apache.pdfbox</groupId>
  <artifactId>pdfbox</artifactId>
  <version>2.0.7</version>
</dependency>
<dependency>
  <groupId>org.apache.pdfbox</groupId>
  <artifactId>fontbox</artifactId>
  <version>2.0.7</version>
</dependency>

我的班级进口:

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.tools.imageio.ImageIOUtil;
import org.apache.pdfbox.tools.PDFText2HTML;
import org.apache.pdfbox.text.PDFTextStripper;

标签: javamavenpdfbox

解决方案


使用 pdfbox-tools:

<dependency>
  <groupId>org.apache.pdfbox</groupId>
  <artifactId>pdfbox-tools</artifactId>
  <version>2.0.15</version>
</dependency>

并将所有(还有 pdfbox 和 fontbox)更新到当前版本,即 2.0.15。修复了许多错误(包括一些安全问题)并进行了改进。


推荐阅读