html - Scrapy - 缺少 html 正文
问题描述
使用 scrapy 一些网站不提供完整的 html 代码,即。https://www.amazon.de/Warner-Bros-5051891109537-GIOCO-MOVIE/dp/B00HR6RHBK
我尝试获取所有报价列表的链接(https://www.amazon.de/gp/offer-listing/B00HR6RHBK/ref=dp_olp_new?ie=UTF8&condition=new)
Scrapy 就是找不到它。
试:
$刮壳“ https://www.amazon.de/Warner-Bros-5051891109537-GIOCO-MOVIE/dp/B00HR6RHBK ”
print(response.xpath("//a[包含(@href, 'new')]/@href"))
结果:
[]
解决方案
该链接在页面源中不存在。所以Scrapy找不到它。尝试寻找 /gp/offer-listing/B00HR6RHBK/ref=dp_olp_all_mbc?ie=UTF8&condition=all 看看你是否能找到那个链接
推荐阅读
- shell - AWK:读取所有行并完全基于另一个文件的每一行操作一个文件
- javascript - ReactJS - 从 redux 获取数据并加载表单的正确方法
- javascript - 以下是在需要在浏览器上运行的 JavaScript 中编写长计算的正确方法吗?
- go - 关于延迟行为的 Go 语言面试问题
- javascript - React Hooks 没有更新
- amazon-web-services - 如何从 Windows 中的 create-key-pair 命令生成 pem 文件?
- android-studio - @SuppressLint("CheckResult") 似乎不起作用
- arrays - 如何使用reduce方法Swift找到匹配的数字计数
- webpack - 默认 webpack 配置
- c# - WPF,将 3 个 RenderTargetBitmap 合并为一个