python - 如何在没有硒的情况下抓取动态网站
问题描述
我面临一个问题,我希望任何人都可以帮助我。我正在尝试在 python 上使用 selenium 包抓取网页,但它不断检测到我正在使用 selenium 并将我重定向到我无法使用的登录页面。我尝试使用假代理,但它仍然检测到我,我尝试更改 chrome 驱动程序中的“$cdc”,但它仍然不起作用。是否有人可以帮助我。这是我正在使用的代码:
options = webdriver.ChromeOptions()
ua = UserAgent()
userAgent = ua.random
options.add_argument('--ignore-certificate-errors')
options.add_argument('--incognito')
options.add_argument("--window-size=1920,1080")
options.add_argument('enable-automation')
options.add_argument(f'user-agent={userAgent}')
#options.add_argument('--headless')
driver = webdriver.Chrome()
driver.get("https://www.mcmaster.com/nuts/hex-nuts/medium-strength-steel-hex-nuts-grade-5/")
解决方案
推荐阅读
- sql - 我需要替换sql中的值
- javascript - node.js 中的 voicestateupdate 存在问题
- hyperledger-fabric - 恐慌:运行时错误:索引超出范围当使用 genesis.block 启动排序器时
- c# - c# 和 Excel Range:如何打印到输出范围
- ruby-on-rails - 在 Rails 中使用通配符访问参数
- docker - 如何在 docker 容器中为 appveyor 服务器 docker 构建运行 docker 命令?
- c# - OnPropertyChanged 有时不会更新 ListView 中的 UI,仅在滚动或其他活动之后
- typescript - Aurelia CLI 项目构建错误取决于环境
- c# - Azure IoT Hub:使用 C# 解决方案的“onChangeStatus”触发器
- javascript - 量角器问题:无法始终如一地工作