selenium - 【NavigableString没有find方法】使用Selenium抓取LinkedIn
问题描述
这是我在堆栈溢出中的第一篇文章。
直截了当,我试图模仿这篇文章:
使用 BeautifulSoup 和 Selenium 从 LinkedIn Jobs 中提取工作信息
我也想注册,这就是我的代码:
driver.find_element_by_xpath("/html/body/header/nav/div/a[2]").click()
sleep(3)
driver.find_element_by_xpath("""//*[@id="username"]""").send_keys("xxx")
driver.find_element_by_xpath("""//*[@id="password"]""").send_keys("xxx")
driver.find_element_by_xpath("""//*[@id="app__container"]/main/div[2]/form/div[3]/button""").click()
sleep(5)
driver.get(url)
sleep(5)
到目前为止,一切都很好。但是,当我到达此代码时:“对于 job_container 中的作业:”该作业的类型为 NavigableString,但它应该是一个标签。
我怀疑这一行没有读取正确的标签:
job_container = lxml_soup.find('ul', class_ = 'jobs-search-results__list list-style-none')
但我不确定什么是正确的。
有人能帮助我吗?谢谢你。
解决方案
更新:
我在 for 循环之前再添加一行,它可以工作:
job_container = job_container.find_all('li', class_ = 'jobs-search-results__list-item')
不知道为什么,就是这样。
推荐阅读
- javascript - 递归承诺 NodeJS 不会终止
- python - beautifulSoap 抓取错误 NameError: name 'soup' is not defined
- pandas - 将具有两个日期列的一个数据框与另一个具有两个日期列的数据框合并
- angular - RxJs Observable 来管理 Skeletons
- python - 带有错误数据的 psycopg2 批量插入
- leaflet - Leaflet.offline 触发器以编程方式保存
- r - 为日期期间提供组 ID
- python - 传递目录路径时出现 argparse 错误中无法识别的参数
- c# - C# Linq - 将空值和周数添加到列表中,当它们丢失时
- javascript - 为什么我的选择器找不到动态添加的元素?