python-3.x - 从动态加载的站点中提取数据
问题描述
我正在制作新的网络抓取应用程序来为我寻找工作。我对 justjoin.it 站点有疑问,该站点在移动滑块时会动态加载工作机会。所以我有一个问题,我是否必须使用例如 selenium 模块来远程移动滑块,或者是否有可能从加载工作机会或任何其他更好的机会获取文件。
到那时我只使用 Python3 中的 requests 和 BeatifulSoup 模块来抓取网站。
解决方案
我会以不同的方式处理它。如果您检查在加载页面时发出的请求(https://justjoin.it/),您会发现有一个负责获取所有优惠:https ://justjoin.it/api/offers .
推荐阅读
- java - ShapeRenderer 没有在图像后面绘制 FilledRectangles
- android - 图像轮播Android计时器
- java - 使用 FIPS 在 Windows 机器上运行 JPackage
- javascript - 尝试使用过滤器数组过滤主数组并获得结果
- javascript - 如何获取 Javascript 跟踪脚本的订单详细信息?
- c# - 如何在 MacOS 上创建每像素 16 位的位图?
- java - Spring Boot Redis 架构设计
- jquery - 如何在 Django 模型中正确使用 jQuery / Ajax 发布
- python - Pygame窗口刚刚制作后没有响应
- multithreading - 函数try-block是否等同于包含整个函数的try-catch?