python - Webscraping 点击按钮 Selenium
问题描述
我正在尝试使用 python、selenium 和 beautifulsoup 在 webscrape Indeed.com 上搜索工作。我想点击下一页,但似乎无法弄清楚如何做到这一点。查看了许多线程,但我不清楚我应该在哪个元素上执行。这是网页 html,当我检查下一个按钮时,会出现标有灰色的代码。
还要提一下,我首先尝试跟踪执行 mousedown 时 url 会发生什么。在阅读 addppurlparam 函数并在函数中添加字符串并使用该 url 之后,我只是被扔回第一页。
这是我用于单击按钮的 selenium 类的代码:
from selenium import webdriver
from selenium.webdriver import ActionChains
driver = webdriver.Chrome("C:/Users/alleballe/Downloads/chromedriver.exe")
driver.get("https://se.indeed.com/Internship-jobb")
print(driver.title)
#assert "Python" in driver.title
elem = driver.find_element_by_class_name("pagination-list")
elem = elem.find_element_by_xpath("//li/a[@aria-label='Nästa']")
print(elem)
assert "No results found." not in driver.page_source
assert elem
action = ActionChains(driver).click(elem)
action.perform()
print(elem)
driver.close()
解决方案
这是工作。分页到下一页。
driver.find_element_by_class_name("pagination-list").find_element_by_tag_name('a').click()
推荐阅读
- google-apps-script - 电子表格需要单独的 Google Apps 脚本部署权限?
- java - 为 ArrayList 中的每个对象打印不同的单词
- flutter - 使用 Flutter Web 接受付款
- python - 如何创建包含按钮和标签的下拉菜单
- r - 尝试加入 dplyr 时出现损坏警告
- c# - CsvHelper 创建空白文件
- javascript - 观看视频时应用程序正在缓冲并花费大量时间 - 性能问题
- jekyll - 为什么我在尝试访问当前内容之外的文件夹时会收到 Jekyll/Liquid 语法错误
- kivy - 带有 PyInstaller 挂钩的 KivyMD - 图像未显示在独立 .exe 中
- javascript - Git 从 HEAD 恢复文件并且文件中没有内容