python - 使用 selenium 抓取弹出搜索结果
问题描述
我试图抓取 PH 新闻网站https://www.philstar.com/但它的搜索结果是一个弹出窗口,所以我必须手动点击搜索和使用驱动程序的所有内容。
search_button = driver.find_element(By.TAG_NAME, "img#search_toggle")
search_button.click()
search_input = driver.find_element(By.TAG_NAME,"input#zoomd")
search_input.send_keys(KEYWORD)
search_input.send_keys(Keys.RETURN)
使用任何关键字搜索后,有一个按钮显示“来自 TOP SEARCHES 的更多信息”,我想单击以加载更多新闻,但我似乎无法通过驱动程序找到它
wait = WebDriverWait(driver, 10)
XPATH = f'//div[@class="zoomd-widget-content-wrapper"]/zoomd-search-results[3]/section/button'
button = wait.until(EC.element_located_to_be_selected((By.XPATH,XPATH)))
button.click()
它似乎是缩放小部件的一部分。知道如何从中刮取吗?
解决方案
你可以尝试通过完整的xpath
,看看它是否有效?对于zoomd
输入,这是路径
/html/body/zoomd-widget-root/zd-widget/div/div[2]/div/zoomd-search-results[3]/section/button
该按钮确实是动态加载的,因此请尝试在点击调用上方添加显式等待以确保它已加载。
推荐阅读
- h2o - How to provide parameter input for interaction variable in H2OGradientBoostingEstimator?
- flutter - Flutter中如何将GridView的Container高度设置为“auto”
- php - 如何直接从亚马逊 s3 下载文件?
- python - 黑体问题和卡方最小化误差
- javascript - 在 React 功能组件中使用 bindActionCreators 和 mapDispatchToProps 给我 undefined
- python - 在python中解析具有多个根的xml数据
- linux - 如何在网卡太新而驱动程序无法包含在任何发行版中的机器上安装 Linux
- python - 在熊猫数据框中保留仅在一个组中的重复值,如果值在其他值之后重复,则打印一些消息
- three.js - three.js + imgui-js 项目中的场景渲染问题
- tinymce - TinyMCE 不适用于所有类似页面