首页 > 解决方案 > Python - requests_html 屏幕抓取

问题描述

我正在尝试登录一个非常复杂(在我的初学者眼中)的网站并进行预订。在开始项目之前不知道一条 python 语句。在多次启动和停止后使用 requests_html/HTMLSession 成功登录。已克服安全/授权问题并到达目标页面。该页面上显示了服务器时间,直到时间到达上午 7:00,我才能按下正确的键。我无法访问该字段。我尝试了 .search 和 .find 命令,但没有。我希望有人能告诉我如何将时间下载到我的程序中,这样我就可以测试时间并等到它到达或几乎到达 7:00。(我之所以这么说几乎是因为预订是针对开球时间的,而且 7 点真的很紧张——这个应用程序的全部意义在于使过程自动化并且是最快的!)

所以我需要能够将时间加载到我的 python 中,并在时钟到达 7:00 时单击日期文件。

标签: pythonweb-scrapingpython-requests-html

解决方案


不知道您使用的是什么抓取工具,但通常您可以通过 xpath 或 css 选择器访问此元素:

response.css(".jquery_server_clock::text").extract()

这个例子是如果你使用scrapy


推荐阅读