python - 如何遍历 CSV 文件 URL 调用 PYTHON
问题描述
我有一个包含 100 万多个 URL 的文件 (urls.csv)。每行都是一个新的网址,例如:
我想获取每个url末尾的json文件,并将其保存为每个url的单独json文件,文件名按顺序为1、2、3、n ...
这是我到目前为止所拥有的:
import requests
import csv
url = []
with open('urls.csv') as csvfile:
csvReader = csv.reader(csvfile)
for row in csvReader:
url.append(row[0])
headers = {'Accept': 'application/json'}
response = requests.get(url, headers=headers)
with open('outputfile.json', 'wb') as outf:
outf.write(response.content)
我应该如何解决这个问题?
解决方案
试试这个:
import requests
import csv
urls = []
with open('urls.csv') as csvfile:
csvReader = csv.reader(csvfile)
for row in csvReader:
urls.append(row[0])
headers = {'Accept': 'application/json'}
for url in urls:
response = requests.get(url, headers=headers)
filename = url.split('/')[-1]
with open(f'{filename}.json', 'wb') as outf:
outf.write(response.content)
因此,假设您的第三个 url 是https://example.com/3
,代码将保存一个以3.json
相应响应命名的文件。
推荐阅读
- python - Pandas:图中的分组和 xticks
- c - 以毫米为单位计算距离的坐标
- knockout.js - 初始化 jQuery 文件上传后,如何将淘汰赛 js 绑定重新应用到文件输入元素?
- mongodb - 将 parse-server / mlab 部署迁移到 MongoDB Atlas
- git - GitHub 在推送到新创建的存储库时出现问题
- sql - Sqlite 中的自定义聚合函数
- python - Pandas/Python 复数,条件和
- project-reactor - 如何在 Reactor 3 中跨多个发布者排队工作?
- c# - 在 C# 中删除一个节点正在创建一个 NULL
- python - 如何确保.kv文件完全加载(on_parent不能解决这个问题)