首页 > 解决方案 > 用于添加异常的正则表达式代码 - python

问题描述

我从数据框中提取了包含网站链接的列来查找网站:

csv_document = pd.read_csv(csv_doc)
tweets = csv_document.Tweet
    
count = {}

for tweet in tweets:
    matches = re.findall(r'http[s]?://([^\/]*)',tweet)
    for match in matches:
        count[match] = count.get(match,0) + 1

正则表达式代码允许我识别所有以 'http | 开头的字符串。https' + '://'。现在我想在正则表达式代码中添加避免所有网站以开头的方式,www.即使它们有http://https://

我试过了(?!www.)

    matches = re.findall(r'http[s]?://([^\/]*)(?!www.)',tweet)

我不工作。如何添加此异常?

我查看了正则表达式网站并无法获得解决方案。

谢谢你。

标签: pythonregex

解决方案


推荐阅读