首页 > 解决方案 > 刮Daraz.pk

问题描述

我是抓取新手,我想从daraz.pk 抓取产品和价格。我从教程中学习,能够从亚马逊抓取数据,但无法在 daraz 中完成。请谁能告诉我如何从此链接获取笔记本电脑产品名称:https ://www.daraz.pk/gaming-laptops/?spm=a2a0e.home.cate_1_4.1.35e349375wfPov

我尝试使用 response.css("c16H9d::text").extract() 但无法检索任何数据。问候

标签: web-scrapingbeautifulsoupscrapyweb-crawler

解决方案


我已经为 Daraz.pkl 的修饰类别编写了此代码。但是,如果您想抓取其他产品,只需在 Url 中添加该页面的链接,然后在下面添加所需的 xpath。

import bs4 as bs
import re
from selenium import webdriver
name=[]
price=[]
url = 'https://www.daraz.pk/dog-grooming-supplies/'

driver = webdriver.Chrome('chromedriver')
driver.get(url)
for i in range(1,40):
  target_name=driver.find_element_by_xpath('//*[@id="root"]/div/div[3]/div[1]/div/div[1]/div[2]/div['+str(i)+']/div/div/div[2]/div[2]/a')
  target_prize=driver.find_element_by_xpath('//*[@id="root"]/div/div[3]/div[1]/div/div[1]/div[2]/div['+str(i)+']/div/div/div[2]/div[3]/span')
name.append(target_name.text)
price.append(target_prize.text)


driver.quit()
print(name)
print(price)

调整意图,如果您发现任何问题,请告诉我,如果您发现任何问题


推荐阅读