python - 如何使索引作业到下一个值的位置?
问题描述
我正在尝试根据内容制作一个代码来重命名 pdf,内容有 3 或 4 个金额,看起来像这样,而第一页上的许多其他数字“银行对账单”看起来像这样:
-Account number/// Beginning balance///Total credits///Total debits///////Ending balance
2120033689/////////$226,913.35 ////////$310.00/////////////////-$300.00////////$226,923.35
我想要得到的是第二个 $ ($310.00) 或第三个 $ (-$300) 之后的数字,如果你们能告诉我如何让程序确定文本中的模式并将其拉出,比如对于帐号,它全是数字,它由 10 个数字组成,有没有办法可以做到这一点?
我的代码:
import PyPDF2
fullpath = file path
pdfFileObj = open(fullpath, 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
pdfReader.numPages
pageObj = pdfReader.getPage(0)
content = pageObj.extractText()
beginloc = content.index("$")
beginingbalance = content[beginloc:beginloc+9]
我的问题是,是否有办法让我的程序获得第二个 $ 符号及其后面的数字,以及是否有办法让它选择某种模式来获取银行帐号?
解决方案
推荐阅读
- cplex - 使用基于条件的脚本在 OPL 中创建元组列表
- java - 如何在 Android 的 TextEdit(或其他视图)中自动填充和验证地址
- http - 当客户端通过 Fiddler 发送重复请求时会发生什么?
- gcc - Objdump / 链接器映射文件符号校验和
- javascript - 在反应中使用axios调用测试功能
- r - 检查字符串是否出现在 data.table 的任何列(第一列除外)中
- pandas - 如何仅使用特定列从现有 df 创建新 df
- python - 熊猫滚动应用返回 ndarrays 的自定义函数
- rest - REST API 最佳实践
- sqlplus - 如何修复 sqlplus 中此列列表错误没有匹配的唯一键或主键?