首页 > 解决方案 > 从用python爬行的网站编写csv

问题描述

我刚刚开始学习编程,现在我遇到了一个问题,我编写了一个可以访问多个网页的爬虫代码,我遇到的问题是我需要将数据保存为两列中的 CSV 文件,source(webpage),target(link)以便 Excel 可以读取但有像 8k 网页,我想用 75k 链接设置它们

更具体地说,这是我正在寻找的输出:所以这是我的代码

url = "https://ontariotechu.ca"
html = urllib.request.urlopen(url, context=ctx).read()
soup = BeautifulSoup(html, 'html.parser')

tags = soup('a')
for tag in tags:
   w.append(tag.get('href'))

这就是我想要存储数据的方式

标签: pythoncsv

解决方案


推荐阅读