python - 用于添加异常的正则表达式代码 - python
问题描述
我从数据框中提取了包含网站链接的列来查找网站:
csv_document = pd.read_csv(csv_doc)
tweets = csv_document.Tweet
count = {}
for tweet in tweets:
matches = re.findall(r'http[s]?://([^\/]*)',tweet)
for match in matches:
count[match] = count.get(match,0) + 1
正则表达式代码允许我识别所有以 'http | 开头的字符串。https' + '://'。现在我想在正则表达式代码中添加避免所有网站以开头的方式,www.
即使它们有http://
或https://
我试过了(?!www.)
:
matches = re.findall(r'http[s]?://([^\/]*)(?!www.)',tweet)
我不工作。如何添加此异常?
我查看了正则表达式网站并无法获得解决方案。
谢谢你。
解决方案
推荐阅读
- javascript - 调整 d3 水平堆叠条的条内的文本
- groovy - 在给定时间间隔后在拓扑中添加新节点
- c++ - ld:未定义的对 `lua_` 的引用。我不知道为什么 ld 不能引用 lua,即使它在那里
- python - 在括号和单引号内查找子字符串
- oracle - 在 Oracle 中连接具有非不同值的表
- performance - 数组初始化运行时间比较 ifort 与 gfortran
- javascript - 为什么“自我时间”在一个有效的空函数中如此之高?
- powershell - 用于在远程机器上安装多个 msi 的 Powershell 脚本
- jquery - 如何在 Angular-Slickgrid 中获取列标题的工具提示?
- c# - 如何从用户控件调用表单内的函数(C# Winforms)