首页 > 解决方案 > 从文本 Python 中删除括号中的时间戳

问题描述

我想删除以下示例文本数据中括号中的所有时间戳。

输入:

经纪人:我能帮你吗?(3s) 顾客:谢谢(40s) 顾客:我有一个关于X 的问题。(8m 1s) 代理:我可以帮忙。登录本网站(记得使用新密码)(11m 31s)

预期输出:

经纪人:我能帮你吗?客户:谢谢客户:我有一个关于 X 的问题。代理:我可以在这里帮忙。登录本网站(记得使用新密码)

我试过re.sub(r'\(.*?\)', '', data)但它没有用,因为它删除了括号中的所有内容。如果不是时间戳,我想将内容保留在括号中,例如,我想在输出中保留“(记住使用新密码)”。

对正则表达式仍然很陌生,所以希望我能在这里得到一些指导。谢谢!

标签: pythonregextimestampretext-segmentation

解决方案


\(\s(\d{1,2}[smh]\s)+\)

仅供参考:.*匹配除行终止符之外的所有内容。


推荐阅读