python - 如何使用 Selenium 从 LinkedIn 公司页面中抓取员工人数?
问题描述
我正在尝试构建一个搜索行业名称的程序,然后单击 LinkedIn 上结果列表中的第一个个人资料并抓取确切的员工人数。我为它编写了代码,我认为它会起作用,但我似乎无法理解为什么代码没有返回确切的员工人数。xpath 似乎是正确的 - 任何帮助都会非常受欢迎!
import time
import re
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from bs4 import BeautifulSoup
driver = webdriver.Chrome()
driver.get('https://www.linkedin.com/login')
nameidElem = driver.find_element_by_id('username')
nameidElem.send_keys('username_here')
pwdidElem = driver.find_element_by_id('password')
pwdidElem.send_keys('password_here')
continueElem = driver.find_element_by_class_name("btn__primary--large")
result = continueElem.submit()
time.sleep(10)
industry = "books"
link = "https://www.linkedin.com/search/results/companies/?keywords=" +
industry + "&origin=GLOBAL_SEARCH_HEADER"
driver.get(link)
firstcompany = driver.find_element_by_class_name("search-result__title")
firstcompany.click()
employees = driver.find_elements_by_xpath('//*[@id="ember1274"]')
number = re.findall(r'\d', employees.text)
print(number)
解决方案
推荐阅读
- apache-spark - Spark 性能:与 LOCAL 和 HDFS 相同
- powershell - 使用 bat 或 ps1 脚本以逗号分隔的哈希值生成特定类型的文件名列表
- iccube - 在 icCube 应用程序(仪表板)的全局过滤器中使用动态 MDX 类别
- aframe - Aframe 1.0.4 - 设置 scene.environment 不更新材质
- c# - 当使用类作为字典的键时:是否有可能指定哪个类属性/变量确定键
- firebase - Firebase 手机认证 accessToken
- java - Spring AOP - 类和方法的自定义注解
- javascript - 有没有办法在 DiscordJS 中获得对旧消息的反应
- c++ - SimpleINI 库 - 无法编译定义了 SI_NO_CONVERSION 的代码
- angular - Angular:gzip http GET 请求返回 0 字节大小但传输了 20mb