python - 如何从 Upwork 网站上抓取 Job 类别及其子类别?
问题描述
朋友们
我试图在 Pyhton 中使用 BeautifulSoup从以下链接中抓取类别和子类别。
但我无法刮掉它一直给我空白列表
我尝试了以下方法:
首先,我尝试从以下方法中仅抓取一个类别,但它给出了空白输出
soup.find('h3',{"class":"m-t-40"})
我试图刮掉所有类别,但它仍然给我空白输出
soup.find_All('h3',{"class":"m-t-40"})
谁能告诉我如何从这个链接中抓取?
提前致谢
解决方案
你可以使用硒
from bs4 import BeautifulSoup
from selenium import webdriver
driver = webdriver.Chrome('/usr/local/bin/chromedriver')
driver.get('https://www.upwork.com/i/freelancer-categories-all/')
soup = BeautifulSoup(driver.page_source, 'html.parser')
for section in soup.find_all('section'):
h3 = section.find('h3', {'class': 'm-t-40'})
if h3:
print(h3.text)
lis = section.find_all('li')
for li in lis:
print(li.text.strip())
输出
Web, Mobile & Software Dev
All Web, Mobile & Software Dev
Ecommerce Development
# And many others
推荐阅读
- django - 即使安装了 psycopg2,在 heroku 中部署时也会出现 ModuleNotFoundError psycopg2
- python - ROS1 catkin_make 失败:调用 catkin_install_python() 时不需要 DESTINATION 参数
- java - 错误的容器:包 javafx.util 不存在
- office365 - Office365 saml2.0 生成断言以登录不同的应用程序
- django - django重定向在electronjs中不起作用
- postgresql - 无法在 GCP 中启动 VPC 内的 RDS
- android - 中心线性渐变的颜色突然变化
- python - 语音识别后的控制
- c# - Serilog : RollingFile is not working in asp.net core with 'appsettings.json'
- python - 如果我有一本字典告诉我每个项目的左、右、上、下,如何构建矩阵(ndarray)?