python - 在 Python 中使用正则表达式获取 txt 文件中的文本块
问题描述
我只是从 python 正则表达式开始。我阅读了许多主题,但无法针对我的问题调整解决方案。
我有一个像这样的文件:
**** FILE.NAME ***
Fisrt sentence
blablabla
blablabla
blablabla
blablabla
Second sentence
blablabla
blablabla
blablabla
blablabla
我正在寻找一个正则表达式来提取我的文件的几个文本块:
Fisrt sentence
blablabla
blablabla
blablabla
blablabla
然后 :
Second sentence
blablabla
blablabla
blablabla
blablabla
句子和blabla块分开。我尝试了这样的事情但没有工作:
^(\w+[^\n]*?)(.*)\n{2}
解决方案
re
一般经验法则:当str
方法足够时不要使用。
.split()
在这种情况下,您可以在多个换行符上调用该方法:
s.split('\n\n')
返回
['Fisrt sentence\n blablabla\n blablabla\n blablabla\n blablabla',
'Second sentence\n blablabla\n blablabla\n blablabla\n blablabla']
推荐阅读
- django - 无法导入“import_export”
- python - Aws SES -> SNS 通知在打开、点击事件中不包括收件人地址?
- perl - 如何从 Perl 中的当前目录移动文件?
- internationalization - 检票口国际化
- google-bigquery - 如何预处理来自 Stackdriver 的 BigQuery 数据
- node.js - 有没有办法查询时间戳中有特定毫秒的文档?[蒙古]
- php - 将 StdClass 对象类型转换为数组
- html - 悬停效果+img上的超链接
- qt - 如何检查 QObject 是否是 QObject 的后代?
- python - 合并多个列表中包含的数据