首页 > 解决方案 > 拆分网址并获取新网址

问题描述

我有很多这样的 url 列表:

https://www.example1.com/var1/var2/var3/
https://www.example2.com/var1/var2/var3/var4
https://www.example4.com/var1/

如果路径部分中有超过 2 个元素,我希望能够仅提取路径的前两个元素。

像这样:

https://www.example1.com/var1/var2/
https://www.example2.com/var1/var2/
https://www.example4.com/var1/

我正在使用 python,我知道我应该使用 Regex,但是我尝试过的代码并没有给我想要的东西。

标签: pythonregexurl

解决方案


你可以str.split("/", 5)使用str.join

前任:

s =  ['https://www.example1.com/var1/var2/var3/', 'https://www.example2.com/var1/var2/var3/var4', 'https://www.example4.com/var1/']

for i in s:
    print( "/".join(i.split("/", 5)[:-1]) )

输出:

https://www.example1.com/var1/var2
https://www.example2.com/var1/var2
https://www.example4.com/var1

推荐阅读