scrapy - 拒绝访问请求 URL 时抓取无限滚动页面
问题描述
以下零售商产品页面有一个无限滚动,它从我无法访问的 URL 请求数据:
https://www.aldoshoes.com/uk/en_UK/men/holiday-party-style
单击“查看全部”后,开发人员工具会显示一个 URL,该 URL 无法显示任何产品数据并给出“不支持的品牌”错误:
我想知道是否可以通过 Scrapy 访问所有产品数据而无需 Selenium。
谢谢你。
解决方案
如果您查看使用浏览器开发工具单击“查看全部”时发出的 HTTP 请求,您会注意到请求标头包含一些特定于应用程序的标头:
x-aldo-region: uk
x-aldo-lang: en_UK
x-aldo-brand: aldoshoes
x-forwarded-akamai-edgescape: undefined
x-aldo-ssr-request-id:
x-aldo-api-version: 2
尝试在您的请求中包含这些标头。
推荐阅读
- asp.net-core - Dotnetcore 2.2 应用程序无法启动
- angular - 全局变量在Angular 7的子功能中不起作用
- php - Wordpress 自定义字段顺序
- swift - 列出您附近的所有信标
- azure - 间歇性 HttpClient 问题 - SslStream 已处理
- php - 000webhost 中的 tmp_name null 使用 Lumen
- php - 语法错误';' 查询数据库到表时
- angular - 错误类型错误:无法读取未定义的属性“无效”
- javascript - 谷歌地图 addDomListener 不起作用。如何解决?
- javascript - 当我已经声明了属性时,无法读取未定义 reactjs 的属性“地图”