web-scraping - 刮Daraz.pk
问题描述
我是抓取新手,我想从daraz.pk 抓取产品和价格。我从教程中学习,能够从亚马逊抓取数据,但无法在 daraz 中完成。请谁能告诉我如何从此链接获取笔记本电脑产品名称:https ://www.daraz.pk/gaming-laptops/?spm=a2a0e.home.cate_1_4.1.35e349375wfPov
我尝试使用 response.css("c16H9d::text").extract() 但无法检索任何数据。问候
解决方案
我已经为 Daraz.pkl 的修饰类别编写了此代码。但是,如果您想抓取其他产品,只需在 Url 中添加该页面的链接,然后在下面添加所需的 xpath。
import bs4 as bs
import re
from selenium import webdriver
name=[]
price=[]
url = 'https://www.daraz.pk/dog-grooming-supplies/'
driver = webdriver.Chrome('chromedriver')
driver.get(url)
for i in range(1,40):
target_name=driver.find_element_by_xpath('//*[@id="root"]/div/div[3]/div[1]/div/div[1]/div[2]/div['+str(i)+']/div/div/div[2]/div[2]/a')
target_prize=driver.find_element_by_xpath('//*[@id="root"]/div/div[3]/div[1]/div/div[1]/div[2]/div['+str(i)+']/div/div/div[2]/div[3]/span')
name.append(target_name.text)
price.append(target_prize.text)
driver.quit()
print(name)
print(price)
调整意图,如果您发现任何问题,请告诉我,如果您发现任何问题
推荐阅读
- c - 为什么 valgrind 仅通过多次运行程序就报告不同的结果(没有泄漏可能/仍然可以到达)?
- java - 一个循环完美运行,下一个相同的循环失败
- r - 通过 r 中另一个变量的类别计算平均值
- material-ui - 使用材料表可编辑功能时如何更改 + 图标位置
- python - databricks:检查挂载点是否已挂载
- r - 访问应用于数据框的函数的嵌套列表项
- php - 类构造函数中的 $this->constant 或 $this->var
- java - Mybatis - 没有任何错误它只是返回 [] 而不是 db 数据
- python - 连接到 Pymssql 时偶尔出错(错误 20009)
- python - 猜最高数问题