python - 如何从 Python 中的正则表达式捕获 URL?
问题描述
import re
string = """position":1,"url":"https://www.flipkart.com/honor-8c-black-64-gb/p/itmfc8c4fsekrpdp?pid=MOBFC8C8FXXNHZ7C&lid=LSTMOBFC8C8FXXNHZ7CZYQGKP&marketplace=FLIPKART,"""
regex = "\w\w\w\w\w\w\w\w\W\W\d\W\W\w\w\w\W\W\W\w\w\w\w\w\W\/\/(...)\"\W"
match = re.findall(regex, string)
print(match)
我只想从上述变量中捕获链接,输出必须以这种方式 -( https://www.flipkart.com/honor-8c-black-64-gb/p/itmfc8c4fsekrpdp?pid=MOBFC8C8FXXNHZ7C&lid=LSTMOBFC8C8FXXNHZ7CZYQGKP&marketplace= FLIPKART)当我运行上面的代码时,它只是给了我空括号
我认为我的正则表达式有问题所以请任何人帮助我
提前致谢。
解决方案
你有一些格式问题。给你(假设这种格式是一致的,否则按照评论中的建议):
import re
string ='"position":1,"url":"https://www.flipkart.com/honor-8c-black-64-gb/p/itmfc8c4fsekrpdp?pid=MOBFC8C8FXXNHZ7C&lid=LSTMOBFC8C8FXXNHZ7CZYQGKP&marketplace=FLIPKART"'
regex = r'\"url\":\"(.*)\"'
match = re.search(regex, string)
print(match.group(1))
推荐阅读
- javascript - 试图注册两个同名的视图 RCTVideo
- jquery - 在 img src 中嵌入 php 代码不允许缩略图
- virtualbox - 无法通过主机获取链接到沙盒 IP 地址的 localhost
- c# - 如何更新或删除一个表中的数据并将该更改反映在另一个表中
- python - 破折号错误地格式化时间序列的 x 轴
- laravel - Composer 找不到 composer.json 文件?
- java - 我是编程新手,一直收到错误消息,不知道如何解决
- html - CSS:调整 div 大小以适应绝对定位的内容
- mysql - DB Design - 按类别显示表格
- assembly - 在 MBR 中指定分区表时,磁盘映像显示为不可引导