java - 我可以使用 Java 捕获警告吗?
问题描述
我正在使用 PdfBox 从 PDF 中提取文本。有时没有可用于 PDF 的 unicode 映射,因此 PdfBox 会发出如下警告:
mar 17, 2021 10:44:11 AM org.apache.pdfbox.pdmodel.font.PDType0Font toUnicode
WARNING: No Unicode mapping for CID+57 (57) in font ArialMT-Identity-H
mar 17, 2021 10:44:11 AM org.apache.pdfbox.pdmodel.font.PDType0Font toUnicode
WARNING: No Unicode mapping for CID+158 (158) in font ArialMT-Identity-H
发生这种情况时,我想改用 OCR。伪代码将是这样的:
try{
String text = getTextUsingPdfBox(PDF)
}
catch(Exception e){
if (e == UnicodeWarning) String text = getTextUsingOCR(PDF)
}
PS:我知道警告不是例外,但你有想法 PS 2:我愿意接受不同的解决方案
解决方案
推荐阅读
- php - PHP处理MySQL逐行查询
- node.js - req.session 在 Heroku(RedisToGo 插件)上运行时未定义,但在本地使用 redistogo url 时可用
- 64-bit - NASM 分段错误
- c - 我的函数没有返回它应该返回的内容
- python - Python 队列未来事件
- python - 在 Ubuntu 实例上安装 mpi4py 时出错
- ios - iOS:遵循 Apple 教程时出现 Segue 问题
- c# - 使用上层类 ASP.NET core 3 的 Id 映射嵌套列表
- flutter - Flutter:我的变量中有 NULL,如何使用我的函数?
- bash - 你如何在 macbook Pro 的 bas 中下标?