python - Cloudflare 保护错误 503 - “检查您的浏览器”
问题描述
我制作了一个脚本来从受 cloudflare 保护的网页中抓取数据。我从这个网站上抓取了大约 25k 个链接,脚本运行良好。我已经能够从该网站提取所有链接,现在想从这些链接中抓取信息。早些时候该脚本运行良好,但由于网站最近的安全更新,我收到了请求库的错误 503 和 selenium 的“检查您的浏览器”网页。有没有办法绕过它?
我也订阅了scraper api 来使用代理和使用“scraper_api”库来发出请求。
我正在分享一些需要删除但出现这些错误的链接:https : //coinatmradar.com/bitcoin_atm/31285/bitcoin-atm-general-bytes-birmingham-altadena-spirits/ https://coinatmradar.com /bitcoin_atm/23676/bitcoin-atm-general-bytes-birmingham-marathon-gas/
已经尝试过其他方法,如 cfscraper、cloud scraper、未检测到的 chromedriver,但没有运气。请尝试抓取任何其他链接并分享任何解决方案。谢谢
解决方案
推荐阅读
- python - 如何使用 mysql 数据库中的元组构建一系列 pyqt5 按钮?
- java - 在另一个 JNI 函数中使用时,Oop 被损坏
- asp.net - 在 AspnetCore AspIdentity 上重用的 Aspidentity 2.2(框架 4.x)
- swift - 评估唯一性时忽略软删除条目的数据库约束
- mysql - 在 AWS Athena 中查询第一个非空值的动态 JSON 字段
- html - 如何在一行中显示文本
- r - tidyverse 分组将小组组合成“其他”
- mysql - 多个左连接显示与最后日期不同的结果
- android - 更新 Firestore 中的单个文档字段
- c# - 如何在不使用 transform.Rotate 的情况下在其本地或世界轴上旋转带有第二个四元数的四元数?