java - 需要从 Selenium Java 中的浏览器获取 PDF 标题
问题描述
需要从 Selenium Java 中的浏览器获取 PDF 标题。
能够使用 PDFBox 和 FontBox 从以下代码中获取内容。但无法阅读 PDF 标题标题。能否请你帮忙。
公共字符串 readPDFInURL() 抛出 EmptyFileException,IOException {
WebDriver driver = new FirefoxDriver();
// page with example pdf document
driver.get("file:///C:/Users/admin/Downloads/theleader.pdf");
URL url = new URL(driver.getCurrentUrl());
InputStream is = url.openStream();
BufferedInputStream fileToParse = new BufferedInputStream(is);
PDDocument document = null;
try {
document = PDDocument.load(fileToParse);
String output = new PDFTextStripper().getText(document);
} finally {
if (document != null) {
document.close();
}
fileToParse.close();
is.close();
}
return output;
}
解决方案
推荐阅读
- php - 如果 PHP 会话变量持续存在,为什么要使用客户端 cookie
- c# - 可能的 VS 问题 Type Local not found in current namespace
- python - Sympy:计算(9,9)矩阵的特征值需要很长时间
- sql - 如何使用 BigQuery 旧版 sql 查询相同的重复字符串字段以获取多个值?
- android - 使用 NDK 20 为 Android 编译 Opus
- amazon-web-services - 从 Glue 目录和 Glue Py Spark 脚本中的动态路径同步 CSV 文件
- sql - 一行正在破坏我的查询效率?
- wix - 如何将图像背景添加到自定义 MSI 对话框?
- android - 使用具有高程和角半径的流的 Android 约束布局
- python - 如何在 Pandas 中添加行切片?