python - 如何在python上使用正则表达式获取链接的特定部分
问题描述
我正在将来自链接配置文件的大量链接输入到一个程序中,该程序将为我获取这些链接配置文件的 ID。(链接是字符串,点击其中大部分将无处可去)
示例 1:“ https://www.linkedin.com/in/facundo-b-barber%C3%A1-86bb41187/ ”
示例 2:“ https://www.linkedin.com/in/facundo-b-barber%C3%A1-86bb41187/sometext ”
如果我输入其中任何一个示例,结果将是:“facundo-b-barber%C3%A1-86bb41187”我遇到的问题是当我有这样的事情时:
示例 3:“ https://www.linkedin.com/in/facundo-b-barber%C3%A1-86bb41187/sometext/anothertext/ ”
输出为:“facundo-b-barber%C3%A1-86bb41187/sometext”
我试过在这个函数中使用 re 模块:
def get_in(url):
parsed = parse.urlparse(url)
lin = parsed.path
lin = re.search(r'/in/(.*)/', lin).group(1)
print(lin)
return lin
我只想获取 id 并删除前面和后面的所有其他内容。
解决方案
这应该工作->
url.split('/')[4]
例子:
>>> url = "https://www.linkedin.com/in/facundo-b-barber%C3%A1-86bb41187/sometext/anothertext/"
>>> url.split('/')[4]
'facundo-b-barber%C3%A1-86bb41187'
>>> url = "https://www.linkedin.com/in/facundo-b-barber%C3%A1-86bb41187/sometext"
>>> url.split('/')[4]
'facundo-b-barber%C3%A1-86bb41187'
>>> url = "https://www.linkedin.com/in/facundo-b-barber%C3%A1-86bb41187/"
>>> url.split('/')[4]
'facundo-b-barber%C3%A1-86bb41187'
推荐阅读
- javascript - 如何将数组与 jQuery.val 一起使用
- sql - 与 max 连接的 SQL 表
- dependencies - 一个用例可以包含和前置相同的其他用例吗?
- mql4 - 更改 request.comment-value?
- json - 图表查询不再支持 accountEnabled 过滤器
- android - com.android.build.api.transform.TransformException:java.lang.RuntimeException:无法预先 dex
- python - Python - 动态地向函数添加变量。为什么这可能?
- javascript - 跨度在父 div 的底部
- c# - Linq选择对象的动态列表c#
- java - 当鼠标不在窗口上时,如何在不冻结的情况下为 UI 设置动画?