scrapy - 如何使用 Scrapy 在仪表板中获取数据?
问题描述
我正在从 getaround.com 抓取一些有关汽车租赁的数据。我最近看到可以从用 Javascript 渲染的日历中使用 scrapy-splash 获取汽车可用性。此网址中给出了一个示例:
https://fr.getaround.com/location-voiture/liege/ford-fiesta-533656
我需要的信息包含在div
带有 class 的标签中owner_calendar_month
。但是,我看到一些数据似乎可以在div
带有 class 的标签中访问js_car_calendar calendar_large
,其中属性data-path
指定/dashboard/cars/533656/calendar
. 您知道如何访问此路径吗?并使用 Scrapy 抓取其中的数据?
解决方案
如果您访问https://fr.getaround.com/dashboard/cars/533656/calendar
,您会收到一条错误消息,提示您必须登录才能查看数据。因此,如果您希望能够抓取该数据,首先您必须在 Scrapy 中创建一个登录网站的方法。
推荐阅读
- html - 将不同的动画应用于单个类中的多个背景图像
- python - UnicodeDecodeError:“utf-8”编解码器无法解码位置 2 中的字节 0xf3:无效的继续字节
- python - 石头剪刀布游戏 Python Count Feature Not Counting full session using functions
- macos - 在 macOS Big Sur 中启用 SIP 时代码签名无效
- swift - iPhone 与 Amplify 的集成
- jestjs - 运行测试时,TypeError: Cannot destruct property 'travelDatas' of '(0 , _GetTravelDatas.getTravelDatas)(...)' 因为它是未定义的
- python - 想要使用 selenium 从 li 标签中获取文本
- mysql - 查询忽略了 where 子句之一,知道为什么会这样吗?
- python-3.x - 无法使用“conda deactivate”或“deactivate”命令停用 venv
- javascript - 在单独的 jsfiddle 中添加 jsfiddle 作为资源 url