首页 > 解决方案 > 如何从 Python 中的 url 中提取一些文本

问题描述

我试图让 python 从 URL 字符串中提取一些文本。

这是 URL https://somewebsite/images/products/SkuName/genricFileName.jpg的示例

SkuName 总是在第 5 个“/”之后出现,并在第 6 个“/”结束

我想提取“SkuName”

import urllib.request

images = input('please enter url list separated by ","')
names = input('please enter images names separated by ","')

images = images.split(',')
names =  names.split(',')

for index, image in enumerate(images):
    urllib.request.urlretrieve(image, "images/{}.jpg".format(names[index])) 
print('images downloaded successfully')   

如您所见,用户必须手动输入 SKU 名称(位于变量“名称”下)

我希望用户只输入一个输入(URL),python 会自动从 URL 字符串中提取 SKUName

谢谢!

标签: pythonparsingurlhyperlink

解决方案


如果您确定 URL 中名称的(绝对)位置不会改变,那么url.split('/')[5]应该可以解决您的问题。


推荐阅读