c# - 如何从横向 PDF 文件中提取文本
问题描述
我正在尝试从横向 pdf 文件中提取文本,我正在使用 iTextSharp,对于纵向页面,它运行良好,但对于横向页面返回一个空字符串。
这是我的代码
PdfReader reader = new PdfReader(pdfFile);
int intPageNum = reader.NumberOfPages;
var sb = new StringBuilder();
for (int i = 1; i <= intPageNum; i++) {
var text = PdfTextExtractor.GetTextFromPage(reader, i, new LocationTextExtractionStrategy());
sb.Append(text + "\n");
}
解决方案
推荐阅读
- java - 如何为@ResponseStatus 创建分支结果
- android - 使用 Firebase 处理后台推送通知,支持 Doze
- python - 如何使用 BeautifulSoup 从父子标签中获取文本以放入 DOCX 表中
- npm - npm 更新检查失败是否意味着 npm 没有安装?
- python - 使用 Keras 进行贪婪分层训练
- c - 使用指针和线程时避免竞争条件
- c# - 如何将树对象绑定到数据网格?
- html - 使屏幕阅读器以不同的方式阅读部分
- php - Wp-admin 页面重定向到 404 错误页面
- python - Flask / SQLAlchemy - 模型数据验证