首页 > 解决方案 > 如何使索引作业到下一个值的位置?

问题描述

我正在尝试根据内容制作一个代码来重命名 pdf,内容有 3 或 4 个金额,看起来像这样,而第一页上的许多其他数字“银行对账单”看起来像这样:

-Account number/// Beginning balance///Total credits///Total debits///////Ending balance
2120033689/////////$226,913.35 ////////$310.00/////////////////-$300.00////////$226,923.35

我想要得到的是第二个 $ ($310.00) 或第三个 $ (-$300) 之后的数字,如果你们能告诉我如何让程序确定文本中的模式并将其拉出,比如对于帐号,它全是数字,它由 10 个数字组成,有没有办法可以做到这一点?

我的代码:

import  PyPDF2
fullpath = file path
pdfFileObj = open(fullpath, 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
pdfReader.numPages
pageObj = pdfReader.getPage(0)
content = pageObj.extractText()
beginloc = content.index("$")
beginingbalance = content[beginloc:beginloc+9]

我的问题是,是否有办法让我的程序获得第二个 $ 符号及其后面的数字,以及是否有办法让它选择某种模式来获取银行帐号?

标签: pythonpypdf2

解决方案


推荐阅读