python - 复杂的正则表达式模式
问题描述
我有以下正在循环的文字字符串:
Some prior text <COMPANY-IDENTIFIER>oranges.txt : 3254323
Some prior text <COMPANY-IDENTIFIER>raisins.txt : 6434422
Some prior text <COMPANY-IDENTIFIER>apples.txt : 932323
我正在尝试将字符串拆分为: <COMPANY-IDENTIFIER>
、文件名和:
我相信<
并且>
是每个字符串的特殊正则表达式字符和文件名更改。
我使用以下模式的变体进行拆分:
pattern = '<COMPANY-IDENTIFIER>(.*): ' #supposed to detect <COMPANY-IDENTIFIER>apples.txt : , etc
the_number = string.split(pattern)[1]
但是我的模式不起作用。
寻找关于我做错了什么的指导。
谢谢。
解决方案
要在这些点拆分,您可以使用正则表达式
r' +<|>| *: *'
正则表达式读取,“匹配一个或多个空格后跟 '<'或'>'或一个或多个空格后跟一个冒号,后跟一个或多个空格”。
"Some prior text <COMPANY-IDENTIFIER>oranges.txt : 3254323"
分为"Some prior text"
、和。"COMPANY-IDENTIFIER"
_"oranges.txt"
"3254323"
推荐阅读
- python - 将项目添加到列表中的元组中
- swift - Swift MessageKit - 参数标签“(类型:)”不匹配任何可用的重载
- excel - Excel 平均值 - 计算变量的数量
- javascript - 查找嵌套对象中的最小值和最大值
- java - Wicket DropDownChoice 选定值
- git - jenkins 作业中的 Github_server 设置和实现
- java - 如何使用循环 JFrame 解决按钮总和
- javascript - 取消屏蔽上下文菜单:JS直接输入地址栏和书签的区别
- twilio - 无需邀请的 Twilio 可编程聊天
- knockout.js - 使用淘汰赛具有动态多个表的集合