首页 > 解决方案 > 使用scrapy抓取无限滚动网站?

问题描述

我正在尝试从该网站https://www.heritagefuneral.com/obituaries/抓取记录, 它正在使用无限滚动,但正在发出返回 json 数据的 ajax 请求。在 json 数据中是一个关键值,即 'html': "< all html code >" 他们实际上将所有 html 代码放在 json 响应中。所以我想我的问题是我将如何解析 json 数据然后抓取html标签需要的信息?我目前正在尝试使用scrapy和selenium。

标签: pythonhtmljsonseleniumscrapy

解决方案


推荐阅读