json - 让我的 re.findall 接受带有 # 符号的网址
问题描述
现在我在python中有这行代码:
urls = re.findall("(?:(?:https?|ftp):\/\/)?[\w/\-?=%.]+\.[\w/\-?=%.]+",str(field))
这会搜索关键字是否在 url 中,但是它不会正确解析包含 # 的 url。我正在尝试解析的示例链接是
但是,解析排除了主题标签及其之后的所有内容:
解决方案
我设法解决了这个问题,我需要在字符类中添加一些符号,这是有效的正则表达式:“(?:(?:https?|ftp)://)?[\w/-?=%. #&+]+.[\w/-?=%.#&+]+"
推荐阅读
- java - 使用其中一个键是动态的 Jackson Json 进行反序列化
- python - datetime.combine() 和 pytz.localize() 之间的区别
- php - php正则表达式仅从数字中删除破折号
- c# - 网站项目上的 Roslyn 编译器错误。找不到 CodeDom
- c++ - 使用 qt creator 和 eigen 库编译程序时出现 lnk2019 错误
- php - WP_Query Events - 即使当天没有安排活动,我如何显示活动日期
- twilio - Twilio - 使用令牌创建客户端的问题
- python-extensions - python随机函数不起作用,我对python很陌生
- java - 如何将批处理文件的输出写入文本文件?
- python - 在 django rest 框架中过滤嵌套序列化器的查询集