python - 使用 Selenium 和 Python 遍历下拉菜单
问题描述
我正在尝试遍历此网址的下拉菜单:https ://www.accuform.com/safety-sign/danger-danger-authorized-personnel-only-MADM006
因此,例如,第一个下拉菜单 - 在选项下 - 列出了不同的材料,我想依次选择每个材料,然后从网页中收集一些其他信息,然后再转到下一个材料。这是我当前的代码:
driver = webdriver.Firefox()
driver.get('https://www.accuform.com/safety-sign/danger-danger-authorized-personnel-only-MADM006')
time.sleep(3)
driver.find_element_by_id('x-mark-icon').click()
select = Select(driver.find_element_by_name('Wiqj7mb4rsAq9LB'))
options = select.options
optionsList = []
driver.find_elements_by_class_name('select-wrapper')[0].click()
element = driver.find_element_by_xpath("//select[@name='Wiqj7mb4rsAq9LB']")
actions = ActionChains(driver)
actions.move_to_element(element).perform()
# driver.execute_script("arguments[0].scrollIntoView();", element)
for option in options: #iterate over the options, place attribute value in list
optionsList.append(option.get_attribute("value"))
for optionValue in optionsList:
print("starting loop on option %s" % optionValue)
# select = WebDriverWait(driver, 10).until(EC.element_to_be_clickable((By.XPATH, "//select[@name='Wiqj7mb4rsAq9LB']")))
# select = Select(select)
select.select_by_value(optionValue)
我从循环开始,但得到了这个错误:
ElementNotInteractableException: Message: Element <option> could not be scrolled into view
然后我添加了 webdriverwait 并得到一个 TimeoutException 错误。
然后我意识到我可能应该单击保存下拉列表的包装器,所以我添加了单击,它确实弹出了菜单,但我仍然得到了 TimeoutException。
所以我想,也许我应该移动到元素,我用动作链线尝试过,我得到了这个错误
WebDriverException: Message: TypeError: rect is undefined
我试图通过使用此代码来避免该错误:
# driver.execute_script("arguments[0].scrollIntoView();", element)
这只是再次导致超时异常。
我对 Python 和 Selenium 很陌生,基本上只是在修改类似问题的 SO 答案中的代码,但没有任何效果。
我正在使用 python 3.6 和当前版本的 Selenium 和 firefox webdriver。
如果有任何不清楚的地方或者您需要更多信息,请告诉我。
非常感谢!
编辑:根据 Kajal Kunda 的回答和评论,我已将代码更新为以下内容:
`material_dropdown = driver.find_element_by_xpath("//input[@class='select-
dropdown']")
driver.execute_script("arguments[0].click();", material_dropdown)
materials=driver.find_elements_by_css_selector("div.select-wrapper
ul.dropdown-content li")
for material in materials:
# material_dropdown =
driver.find_element_by_xpath("//input[@class='select-dropdown']")
# driver.execute_script("arguments[0].click();", material_dropdown)
# materials=driver.find_elements_by_css_selector("div.select-wrapper ul.dropdown-content li")
material_ele=material.find_element_by_tag_name('span')
if material_ele.text!='':
material_ele.click()
time.sleep(5)
price = driver.find_element_by_class_name("dataPriceDisplay")
print(price.text)`
结果是它成功打印了第一种材料的价格,但随后返回:
StaleElementReferenceException: Message: The element reference of <li class=""> is stale;...
我尝试过在循环内外使用散列线的变体,但总是得到 StaleElementReferenceException 错误的版本。
有什么建议么?
谢谢!
解决方案
你可以用requests
. 从下拉列表中列出的选项中获取下拉列表,然后将value
属性连接到请求 url 中,该 url 检索包含页面上所有信息的 json。同样的原则适用于添加其他下拉值。每个下拉选择的 id 是下拉选项的value
属性,并出现在我//
为每个下拉选择显示的 url 中。
import requests
from bs4 import BeautifulSoup as bs
url = 'https://www.accuform.com/product/getSku/danger-danger-authorized-personnel-only-MADM006/1/false/null//{}//WHFIw3xXmQx8zlz//6wr93DdrFo5JV//WdnO0RpwKpc4fGF'
startURL = 'https://www.accuform.com/safety-sign/danger-danger-authorized-personnel-only-MADM006'
res = requests.get(startURL)
soup = bs(res.content, 'lxml')
materials = [item['value'] for item in soup.select('#Wiqj7mb4rsAq9LB option')]
sizes = [item['value'] for item in soup.select('#WvXESrTyQjM3Ciw option')]
languages = [item['value'] for item in soup.select('#WUYWGMePtpmpmhy option')]
units = [item['value'] for item in soup.select('#W91eqaJ0WPXwe9b option')]
for material in materials:
data = requests.get(url.format(material)).json()
soup = bs(data['dataMaterialBullets'], 'lxml')
lines = [item.text for item in soup.select('li')]
print(lines)
print(data['dataPriceDisplay'])
# etc......
JSON 示例:
推荐阅读
- elasticsearch - 如何按同义词的一部分进行搜索
- java - 批量插入相关表
- security - 如何从 /etc/sysctl.d/ 目录读取配置文件?
- kubernetes - K8 将节点状态更改为未就绪
- ios - URLSession 不发送可编码结构作为请求正文
- java - SonarQube:使用 Java 11 时出现不支持的类文件主要版本 58 错误
- angular - Angular - 在导航内容中添加自定义组件
- asp.net - 七宝 c# api 和 ASP.net
- c++ - 如何将 C++ STL 向量迭代器转换为向量反向迭代器?
- node.js - 如何在 Node.js 中将文件从服务器发送到客户端