python - Python Web Scraping - 动态加载页面
问题描述
我正在使用 python scrapy 框架(接受其他库的建议)来抓取机票网站,但是在请求页面时它不会返回整个内容。
该页面有一些以价格作为响应的 POST 请求,但此查询需要几秒钟,所以我没有得到完整的 HTML。
查询前的页面:
<div id="prices">
</div>
查询后的页面:
<div id="prices">
<div id="price">
Flight price with info
</div>
<div id="price">
Flight price with info
</div>
<div id="price">
Flight price with info
</div>
</div>
我不确定我是否可以伪造 POST 请求并获得 json 响应,因为有一些 API 端点保护。
完全加载后,如何在查询后获取页面?
解决方案
推荐阅读
- ios - Iphone keyboard, input and Safari issue
- mongodb - create mongoose schema in correct way and insert document
- angular - Angular - Redirect to index.html when used as a WordPress theme
- ruby - 如何根据键starts_with对哈希内容进行分组?
- sql - 根据条件添加删除行并在两个日期之间重复它们
- math - 如何在tinymce中自动为乳胶添加分隔符
- html - 是否可以在 Visual Studio 代码的一个父标记内更新属于多个子项的一个属性
- php - JSON 中的 setStatusCode() 在正文中返回标头
- python - 在字符串pickle中用下划线替换空格
- docker - Jupyter 笔记本终端在 /root 文件夹中启动。如何在 dockerfile 中更改 /nfs 的默认路径