scroll - 如何抓取不使用 AJAX 和 Scrapy 的无限滚动页面?
问题描述
我正在尝试抓取此页面中具有无限滚动的所有结果:
我想获取列出项目的所有数量,但到目前为止我只得到 32 个,因为页面一开始只加载 32 个结果。此页面不使用 AJAX/JSON,因此我无法轻松获取所有页面
这是我的代码,适用于前 32 个结果^^:
import scrapy
class QuotesSpider(scrapy.Spider):
name = "sadfrogs"
def start_requests(self):
urls = [
'https://opensea.io/collection/sad-frogs-district?search[priceFilter][symbol]=ETH&search[priceFilter][min]=0&search[priceFilter][max]=1&search[toggles][0]=BUY_NOW',
]
for url in urls:
yield scrapy.Request(url=url, callback=self.parse)
def parse(self, response):
numero = response.xpath("//div[@class='AssetCardFooter--name']/text()").extract()
print (numero)
print (len(numero))
解决方案
推荐阅读
- css - 在 Flex 中,当 flex 方向为 row-reverse 时,将项目向左对齐
- kubernetes - Kubernetes - 用于嵌套变量的 ConfigMap
- r - 如何在一行中为多个变量分配相同的值?
- javascript - 拒绝在框架中显示 Facebook URL,因为它将“X-Frame-Options”设置为“拒绝”
- ios - EXC_BAD_ACCESS KERN_INVALID_ADDRESS ios < 9.3 xcode 10
- c# - 为什么在轮询期间添加一个微小的延迟会降低 CPU 使用率?
- node.js - nodejs 测试在 CircleCI 上随机失败
- php - 无法使用 Codeigniter 从数据库中获取部分数据
- jquery - 在文件上传控件中获取完整路径 - web
- sql - Sql - 从带有条件的查询结果中分配多个变量