python - python中的requests.get(url)在循环中使用时表现不同
问题描述
我是 python 编程的新手,并试图抓取 Urls.txt文件中可用的每个链接。我写的代码是:
import requests
from bs4 import BeautifulSoup
from fake_useragent import UserAgent
user_agent = UserAgent()
fp = open("Urls.txt", "r")
values = fp.readlines()
fin = open("soup.html", "a")
for link in values:
print( link )
page = requests.get(link, headers={"user-agent": user_agent.chrome})
html = page.content
soup = BeautifulSoup(html, "html.parser")
fin.write(str(soup))
当链接直接作为字符串而不是变量提供时,代码工作得非常好,但是当使用它时输出不同。
解决方案
也许您从文件中读取的字符串有换行符。要删除它,请使用link.strip("\n")
推荐阅读
- javascript - 如何从 face-api.js 中提取检测到的人脸
- python - 如何检测脚本中的python包名
- python - FIleNotFoundError Python
- sqlite - Flutter 在线/离线模式
- kubernetes - 在 AKS 中安装入口后指标服务器中的超时
- java - jsch 0.1.55 抛出 java.io.IOException: End of IO Stream Read
- powerbi - 将动态变量应用于条件 Dax
- r - 在 data.table 中对条件链接值进行分组
- node.js - 如何在 Strapi 中创建不同的管理员角色
- python - 如何创建一个包含两个不同查询集的表