首页 > 解决方案 > 需要从 Selenium Java 中的浏览器获取 PDF 标题

问题描述

需要从 Selenium Java 中的浏览器获取 PDF 标题。

能够使用 PDFBox 和 FontBox 从以下代码中获取内容。但无法阅读 PDF 标题标题。能否请你帮忙。

公共字符串 readPDFInURL() 抛出 EmptyFileException,IOException {

    WebDriver driver = new FirefoxDriver();

    // page with example pdf document

    driver.get("file:///C:/Users/admin/Downloads/theleader.pdf");

    URL url = new URL(driver.getCurrentUrl());

    InputStream is = url.openStream();

    BufferedInputStream fileToParse = new BufferedInputStream(is);

    PDDocument document = null;

    try {

        document = PDDocument.load(fileToParse);

        String output = new PDFTextStripper().getText(document);

    } finally {

        if (document != null) {

            document.close();

        }

        fileToParse.close();

        is.close();

    }

    return output;

}

标签: javapdfselenium-webdriverpdfbox

解决方案


推荐阅读