python - Python:提取两个节号之间的段落
问题描述
我正在学习正则表达式并在两个节号之间提取一段。任何意见都非常感谢!
关于我想要实现的一些信息。我想从贷款合同中提取保密部分。因此,我的段落将以节号和“机密性”一词开头。它将在下一个节号处停止。
这是我的代码:
with open('filename.txt') as f:
confi= re.findall(r'\d{1,2}\.\d{1,2}\s*Confidentiality\.\s*(.*?)\d{1,2}\.\d{1,2}',f.read(), re.DOTALL)
这是示例段落:
13.18 保密。如果任何借款人向代理、平面图代理或任何放款人提供,(…) 本第13.18条项下的保密义务不适用于信息的这些部分 (…) 参与者和潜在受让人和参与者同意受本第 13.18 节条款的约束,(……)本协议项下强加给它的此类信息。13.19 放弃陪审团审判。
但是,代码没有捕获 13.18 和 13.19 之间的段落,而是在段落中间的“Section 13.18”处。复杂之处在于节号并不总是保持 13.18,而是随着不同的文本文件而变化。我很欣赏你的评论!
解决方案
推荐阅读
- android - 对同一个 ID 多次使用 @+id/
- aem - i18n AEM6.0 中的覆盖问题
- python - how to solve: AttributeError: 'generator' object has no attribute 'ndim'
- c# - 带有进度跟踪c#的文件上传
- node.js - 在 Angular - 节点应用程序中找不到正确的图像路径
- php - 如果用户名已注册,如何抛出错误消息
- node.js - 在树莓派 3 问题上安装 Node.js
- python - Django REST Framework:序列化器更新对象(如果存在)(通过唯一的一起)
- querydsl - JPAQuery 到 JPASubQuery,反之亦然
- android - Cordova 应用程序已停止 android 模拟器中的问题