首页 > 解决方案 > 如何从提取的文本中仅打印特定数据?

问题描述

我已经提取了文本,但我已经需要一段文本。如何只从文本中打印想要的部分而忽略所有其他部分?

BZN SEA AS LYS VIE OS

B 节 Œ 代码共享交叉引用

范围内:见附带条件: 1. 芬兰 AY 2. 印度 9W 3. 意大利 AZ 4. 日本 JL 5. 墨西哥 AM 6. 俄罗斯 SU 7. 英国 BE 8. 美国 DL 9. 越南 VN

2 AF 法国航空
057

C 节 Œ 附带条件

  1. 在 PTC2 中,我只想要 B 部分而不想要其他内容

导入 PyPDF2 pdfFileObj = open('proviso1.pdf', 'rb') pdfReader = PyPDF2.PdfFileReader(pdfFileObj) for i in range(0,12):

pageObj = pdfReader.getPage(i)
print(pageObj.extractText())

pdfFileObj.close()

我已经用这个提取了

我只想使用 B 部分

标签: python-3.xpdfsplittext-extraction

解决方案


是的,正则表达式是我能想到的唯一方法。

要了解如何根据要求编写正则表达式,请参考 -

https://docs.python.org/3/howto/regex.html


推荐阅读