首页 > 解决方案 > 如何在Regex Python中的每个子字符串之后拆分字符串

问题描述

我有公司和身份证的长文本。我想将字符串拆分为一个列表,其中一个项目以 ID 结尾。每个 ID 由 5 位数字组成,并以相同的格式出现在文本中\(ID\:\d{5}\)

text = "Company A, Inc(ID:12345), some-company, X (ID:12324), Some Special Company Z (ID:34324)"

我想得到的是以下内容:

["Company A, Inc (ID:12345)", "some-company, X (ID:12324)", "Some Special Company Z (ID:34324)"]

有没有办法用正则表达式做到这一点?提前致谢!

标签: pythonregexsplit

解决方案


尝试

a=re.findall(r'(.*?\(ID\:\d{5}\))',text)
print(a)

输出

['Company A, Inc(ID:12345)',
 ', some-company, X (ID:12324)',
 ', Some Special Company Z (ID:34324)']

推荐阅读