首页 > 解决方案 > 正则表达式删除单词和查找单词

问题描述

我想在一个句子中找到并删除https部分。我使用re.search("^https://t.co/.*[a-zA-Z]",data)` 结果是:

match='https://xx.x/ekGSeJufuH 7 jalan indonesia yang pa

match='https://xx.x/okbymT3g'

但我想match='https://xx.x/ekGSeJufuH在保留其余单词的同时删除和删除。我的正则表达式有问题吗?

标签: pythonregex

解决方案


.* 匹配任何字符,包括空格。

一个更简单的方法是

  1. 找到以“https://”开头的句子,
  2. 找到句子中的第一个空格(''),
  3. 删除空格前的子字符串。

我认为它有效,因为 URL 不允许内部有任何 WS。


推荐阅读