首页 > 解决方案 > 在 Python 中使用正则表达式获取 txt 文件中的文本块

问题描述

我只是从 python 正则表达式开始。我阅读了许多主题,但无法针对我的问题调整解决方案。

我有一个像这样的文件:

**** FILE.NAME ***
Fisrt sentence
    blablabla
    blablabla
    blablabla
    blablabla

Second sentence
    blablabla
    blablabla
    blablabla
    blablabla

我正在寻找一个正则表达式来提取我的文件的几个文本块:

Fisrt sentence
    blablabla
    blablabla
    blablabla
    blablabla

然后 :

Second sentence
    blablabla
    blablabla
    blablabla
    blablabla

句子和blabla块分开。我尝试了这样的事情但没有工作:

^(\w+[^\n]*?)(.*)\n{2}

标签: pythonregex

解决方案


re一般经验法则:当str方法足够时不要使用。

.split()在这种情况下,您可以在多个换行符上调用该方法:

s.split('\n\n')

返回

['Fisrt sentence\n    blablabla\n    blablabla\n    blablabla\n    blablabla',
 'Second sentence\n    blablabla\n    blablabla\n    blablabla\n    blablabla']

推荐阅读