python - 拆分网址并获取新网址
问题描述
我有很多这样的 url 列表:
https://www.example1.com/var1/var2/var3/
https://www.example2.com/var1/var2/var3/var4
https://www.example4.com/var1/
如果路径部分中有超过 2 个元素,我希望能够仅提取路径的前两个元素。
像这样:
https://www.example1.com/var1/var2/
https://www.example2.com/var1/var2/
https://www.example4.com/var1/
我正在使用 python,我知道我应该使用 Regex,但是我尝试过的代码并没有给我想要的东西。
解决方案
你可以str.split("/", 5)
使用str.join
前任:
s = ['https://www.example1.com/var1/var2/var3/', 'https://www.example2.com/var1/var2/var3/var4', 'https://www.example4.com/var1/']
for i in s:
print( "/".join(i.split("/", 5)[:-1]) )
输出:
https://www.example1.com/var1/var2
https://www.example2.com/var1/var2
https://www.example4.com/var1
推荐阅读
- java - 连接到 mysql 数据库的 java 销售点系统
- java - 如何使用 Selenium 和 Java 通过 sendKeys 方法传递双引号字符串
- javascript - 对于一个简单的 RESTful API 应用程序,如何使用 Node Js 和 Express 显示带有 GET 请求的对象数组
- vbscript - 如何使用 Classic ASP 和 Strict OAuth 2.0 获取 GoToWebinar 的访问令牌
- ios - 如何解决 Xcode kivy-ios 中的“动态模块未定义模块导出功能”错误?
- javascript - 单击时滚动更多数据
- python - 仅返回通过的测试数和失败的测试数
- javascript - 使用 Console.log 时数组不打印
- cassandra - 使用不同版本和操作系统引导 cassandra
- django - 使用 Nginx 和 gunicorn 在 django 中提供静态文件