javascript - 包含 JSP/JS 的 Python Beautiful Soup 抓取页面
问题描述
我想从这个页面上刮价格:url = https://www.renodepot.com/en/steph-round-base-shower-kit-69375118
价格信息在跨度标签中给出,我无法抓取它。我为此使用的简单代码是
from requests import get
from bs4 import BeautifulSoup
response = get(url)
html_soup = BeautifulSoup(response.text, 'html.parser')
ProductPrice = html_soup.find('div',class_ = 'product_price_wrapper')
但这没有任何回报,我想
BEGIN RenoProdDetailPriceSnippet.jsp
显示在价格 div 选项卡上方的信息会导致信息受到保护。
我什至尝试用硒来做,但没有成功。我尝试了许多其他组合来获得价格,但无法获得相同的价格。
所以,我正在寻找一些想法来解决这个问题。谢谢
解决方案
您无法抓取该页面,因为它需要完成 reCAPTCHA 才能访问。这是专门为阻止机器人而设计的。
如果您检查html_soup
,您会发现您实际上是在搜索 reCAPTCHA 页面,而不是所需的产品页面。
推荐阅读
- c# - Godot C#“来自信号的错误调用方法”
- ruby-on-rails - 如何在 Ruby CSV 中导入数据之前检查标头是否存在?
- html - 如何将图像的背景颜色设置为黑色?
- c# - 如何仅在 Google 表格中为特定单元格更新前景色
- api - Rails 6:版本控制 API 时没有方法错误
- javascript - 调用节点模块中的类中的函数时获取“无法读取未定义的属性”
- bash - Gitlab-CI CE 执行器 /usr/bin/bash:第 113 行:git:找不到命令
- ksh - KSH - 在参数扩展中请求“\n”替换的示例
- sql - 过滤行以返回确切的关系
- flutter - 'package:splashscreen/splashscreen.dart' 是遗留的,不应导入到空安全库中