首页 > 解决方案 > 我想刮掉这部分

问题描述

我正在尝试抓取屏幕截图中的每个面板,但我没有正确的 xpath 来抓取这些部分。任何人都可以帮助我。

在此处输入图像描述

https://www.seloger.com/annonces/achat/appartement/paris-15eme-75/saint-lambert/142632059.htm?cp=75&idtt=2,5&idtypebien=2,1&LISTING-LISTpg=2&naturebien=1,2, 4&tri=初始&

标签: python-3.xweb-scrapingscrapy

解决方案


此数据来自附加请求https://www.seloger.com/detail,json,caracteristique_bien.json?idannonce=142632059。在那里,您将获得包含全部信息的 json。

升级版:

url_id = re.search(r'/(\d+)\.htm', response.url).group(1)
details_url = 'https://www.seloger.com/detail,json,caracteristique_bien.json?idannonce={}'
# make request to url
yield Request(details_url.format(url_id))

推荐阅读