.net - iText - 获取符号组合的位置
问题描述
我找不到如何使用 iText API 获取 PDF 文档中特定符号组合(例如 +< )的位置 (x,y) 的示例。我可以找到带有此类符号的行或块的位置。但据我所知,即使这些符号在文档中作为单独的单词,也不能保证它将是单独的块。
解决方案
您要查找的课程是RegexBasedLocationExtractionStrategy
.
您可以使用String
表示正则表达式的对象来构造它,或者直接将正则表达式提供给它。
PdfPage
然后使用 a将其应用于a PdfCanvasProcessor
,然后调用getResultantLocations
。
PdfDocument pdfDoc = new PdfDocument(new PdfReader(SRC));
RegexBasedLocationExtractionStrategy extractionStrategy = new RegexBasedLocationExtractionStrategy(@"foobar");
IList<IPdfTextLocation> locationList = new List<IPdfTextLocation>();
PdfCanvasProcessor parser = new PdfCanvasProcessor(extractionStrategy);
parser.ProcessPageContent(pdfDoc.GetFirstPage());
extractionStrategy.GetResultantLocations(); // do something with them
推荐阅读
- c# - 有什么方法可以防止使用新 csproj 格式的 .NET 应用程序存在于 bin/debug/net472/AppName 中?
- powershell - 在 VSCode 的 PowerShell 命令提示符中隐藏完整文件路径
- python - 在 django 中加载图像时的可疑操作
- vue.js - Webpack:为什么 vue-loader 不能转译?
- javascript - 使用 Formdata React Native 将图像上传到 Firebase
- sql - 使用 ORACLE SQL 从具有不同 ID 的同一表中查找重复项?
- r - R中的曲线和绘图函数有什么区别?
- c# - 将值传递给自定义属性
- google-app-engine - 基于 GAE/GO 标准的 MIP 求解器
- ionic-framework - 如何在本地禁用 Ionic AppFlow 监控?