python - 提取json文件中的所有链接
问题描述
在我设法获得一个巨大的 json 文件的那一刻,我正在尝试学习 python,我想从中提取所有链接并下载它们。
import json
import urllib3
urllib3.disable_warnings()
url = 'https://www.reddit.com/r/EarthPorn/top/.json'
http = urllib3.PoolManager()
suffix = ['.jpg','.png','.gif','.bmp']
while True:
response = http.request('GET',url)
myData = response.data
parsedJson = json.loads(myData)
finalUrl = parsedjson[0]['data']['children'][0]['data']['url']
print(finalUrl)
目前我在 finalUrl 行上遇到错误,所以我认为我在尝试获取 json 文件中的每个 url 时出错。
解决方案
为什么不尝试使用循环遍历所有链接
for i in parsedjson['data']['children']:
finalUrl =i['data']['url']
print(finalUrl)
输出
https://i.imgur.com/Vc7MDDf.jpg
https://i.redd.it/szj6wnw2foi11.jpg
https://i.redd.it/5k8vgy173mi11.jpg
https://i.imgur.com/zRLJzVj .jpg
https://i.redd.it/9nab5nvi4mi11.jpg
https://i.redd.it/9zgnp3z1gmi11.jpg
https://i.redd.it/ulhtdcomsoi11.jpg
https://i.redd.it /yjthueewmmi11.jpg
https://i.redd.it/gtdm76o3yni11.jpg
https://i.redd.it/1j7ez5alloi11.jpg
https://i.imgur.com/8xNGW6T.jpg
https://i.redd .it/13fk1b3rhki11.jpg
https://imgur.com/OUw1N5z
https://i.redd.it/qqfb57u53ni11.jpg
https://i.redd.it/17fs1whd3pi11.jpg
https://i.redd.it /kjwv5p15qni11.png
https://i.redd.it/oayns08fjqi11.jpg
https://i.imgur.com/xXNK4mu.jpg
https://i.redd.it/px53p4e2ski11.jpg
https://i.redd.it/ncjytopnami11.jpg
https://i.imgur.com/5pcww4b.jpg
https://i.redd.it/ecbs9yao5ni11 .jpg
https://i.redd.it/10210k2rpli11.jpg
https://i.redd.it/xxs7h8ng1qi11.jpg
https://i.redd.it/5toz9ercjni11.jpg
希望这是您正在寻找的
推荐阅读
- javascript - 正则表达式获得与给定字符串最接近的匹配
- python - 如何从多个文件夹和文件中读取特定段落
- visual-studio-2008 - Visual Studio 2008 中的安装项目无法注册 dll
- angular - 上传到 azure blob 存储 - this.blobStorage.createBlobServiceWithSas 不是函数
- python - 启动内核(spyder)时发生错误
- x86 - Intel的AVX2中的XOR指令“VPXORD”、“VXORPS”和“VXORPD”有什么区别
- android - 在相同的片段类型之间滑动
- java - java.lang.InstantiationException 尝试实例化子类时出错
- django - Django:将一个应用程序中的表单添加到另一个应用程序模板中(详细视图)
- c# - ASP.Net Core Anchor 路由到控制器中的操作