python - Scrapy 从网站返回未更新的数据
问题描述
我正在为网站创建产品监视器,但遇到了问题。爬取时,Scrapy 没有获取站点的更新版本。当我在有货的情况下进行爬网时,来自站点的 json 数据返回 OutOfStock。如果我从浏览器查看网站,则 JSON 变量是 InStock。如果我 cURL 网站,JSON 变量是 InStock。
如果我使用 scrapy 检查始终有货的产品,JSON 变量会返回 InStock。
我用蜘蛛尝试了不同的设置,但没有任何效果。
我也尝试使用该scrapy fetch
命令,并在一个 scrapy shell 中进行抓取,但没有给我更新的 JSON 数据。
JSON 数据位于网站上的 ld+json 脚本元素中。
这是我试图抓取的网站:https ://www.target.com/p/meshmonitors/-/A-79659825
解决方案
推荐阅读
- apache-kafka - spring cloud stream kafka KTable作为输入不起作用
- android - React-Native 应用程序在某些 Android 手机中崩溃
- google-apps-script - 在 google app 脚本中咨询 group by
- sql-server - 如何使用 SSIS 加载 Excel 文件的多个电子表格的特定列?
- python - 如何从 2 个数组中选择项目?
- javascript - React 应用程序抛出错误无法读取嵌套承诺中未定义的属性“setState”
- google-maps - 如何使用 Flutter 获得真正的方向步骤?(绘制真实路线)
- javascript - 如何在 Fullcalandar 中同时显示背景渲染和事件背景?
- python - 如何使用 selenium 和 beautifulsoup 单击元素?
- c# - 按钮太小了两个像素