python-3.x - 我想刮掉这部分
问题描述
我正在尝试抓取屏幕截图中的每个面板,但我没有正确的 xpath 来抓取这些部分。任何人都可以帮助我。
解决方案
此数据来自附加请求https://www.seloger.com/detail,json,caracteristique_bien.json?idannonce=142632059
。在那里,您将获得包含全部信息的 json。
升级版:
url_id = re.search(r'/(\d+)\.htm', response.url).group(1)
details_url = 'https://www.seloger.com/detail,json,caracteristique_bien.json?idannonce={}'
# make request to url
yield Request(details_url.format(url_id))
推荐阅读
- c# - 如何解析不完全对应的json
- python - 将字符串列添加到浮点矩阵 NumPy
- sql-server - 尝试选择不同的值,并且必须格式化日期和排序,就像它在 MS SQL 服务器上的日期时间一样
- python - 边列表中节点的唯一列表
- r - R Leaflet - addPolylines - 不断添加区域名称
- javascript - Ajaxmin MinifyJavascript 在对象前添加 {}
- javascript - reCaptcha 是否与 iFrame 兼容?
- c# - 在父元素中覆盖 DataContext 后在子元素中使用 Window DataContext
- azure-devops - 通过 Graph API 更新用户“必须参考服务操作或实体集”
- javascript - selected-js 生成的默认 WIDTH = 0