首页 > 解决方案 > 用beautifulsoup和python抓取按钮点击时取消隐藏的文本?

问题描述

所以我试图用以下网址抓取: 网站

该页面有一些隐藏的文本,点击后会解锁。他们的 HTML 代码在按钮点击后也被隐藏和取消隐藏。

点击前:

点击图片之前

点击后:

点击图片后

我怎样才能刮掉这段文字?

BeautifulSoup 不适用于此文本。

标签: pythonhtmlseleniumbeautifulsoup

解决方案


如果您打开开发工具并单击这些按钮,您会看到您向https://en.indonetwork.co.id/ajax发出了发布请求。

因此,您可以尝试复制它 - 看看您是否可以从主页的抓取中捕获发布请求中发送的有效负载并将其发送。

或者您可以使用 selenium 加载页面,单击按钮,然后捕获数据。


推荐阅读