python - 如何从 url 列表中提取文本并分别保存
问题描述
我有一个网址列表。该列表中有 100 个 url,所有这些 url 都包含文本。我想从这些 url 中提取文本并将这些文本保存在 text1、text2、text3 等中。我只能做到这一点。
list_of_urls = ['abc.com', 'def.com', 'sssj.com', ... and so on]
import urllib
text = []
data = urllib.request.urlopen('abc.com')
for line in data:
line = line.decode('utf-8')
text.append(line)
以上代码仅适用于一个网址。但我想遍历列表中的所有 url 并将输出存储在 text1、text2、text3 等中。
解决方案
我不确定您希望如何存储单独的文本,但此代码将创建一个字典,其中键是 text1、text2、...,值是包含该文本中句子的列表。
import urllib
list_of_urls = ['abc.com', 'def.com', 'sssj.com', ... and so on]
result = {}
for idx, url in enumerate(list_of_urls):
data = urllib.request.urlopen(url)
text = []
for line in data:
line = line.decode('utf-8')
text.append(line)
result[f"text{idx}"] = text
推荐阅读
- android - 在 Fragment 内的 HorizontalScrollView 中捕捉
- java - 如何在androidX中实现一个警告对话框
- flutter - 如何将 Row 中每个元素的大小设置为最小元素?(反向 IntrinsicWidth 或 IntrinsicHeight)
- python - CSV.writer 将每个集合条目放在一个新行上
- solr - Solr Facet,如何仅排除主要查询?
- websocket - 从套接字连接获取数据而不再次发送
- linux-kernel - 搭建Linux设备驱动开发环境
- amazon-web-services - AWS SQS 备份解决方案设计
- html - 使用 flexbox 创建相同高度的卡片列表
- java - 陈旧元素异常,元素不可点击,元素点击被拦截并且没有此类元素错误由同一元素交替显示