python - 找不到标签或无法拉取内容时如何重新加载页面?
问题描述
我想修改下面的代码,以便在“xy”或“href”类不可用时刷新相应的 URL。该代码是网络爬虫的一部分,有时它面临验证码或错误。目前,我的代码只是跳转到下一页,但如果第一次尝试无法显示,我需要先刷新页面。
url_pull = url.find('a',class_ = 'xy')
partial_url = url_pull.get('href')
pageURL = 'http://xxx'+partial_url
Url_list.append(pageURL)
解决方案
你可以使用一个While True
条件,break
如果你找到了一个结果。
所以,像:
while True:
url_pull = url.find('a', class_='xy')
partial_url = url_pull.get('href')
if url_pull or partial_url is not None:
break
sleep(5)
推荐阅读
- amazon-web-services - 在 Cognito 用户池上配置 Twitter
- android - 通过 WiFi 连接检查互联网连接状态以发出通知
- makefile - 您为 mpif90 编译器调试器/编译器设置了哪些标志来捕获错误代码?
- average - 从具有多个图层的光栅文件创建单个光栅文件并平均像素值
- php - PHP curl:无法根据日期存档文件,得到 curl 错误:1
- prepared-statement - 代理 SQL 准备好的语句客户端缓存是否可用?
- pandas - 如何在导航器上安装 cartopy
- javascript - 无法使用 jest 框架测试 React.js 项目的道具类型
- google-apps-script - 从谷歌工作表发送 excel 附件,但只发送当前选项卡
- vue.js - laravel-mix vuejs 动态应用主题 - LIGHT/DARK