首页 > 解决方案 > 如何遍历这些页面并从每个页面中抓取信息?

问题描述

我是编程新手,需要一些关于我的网络爬虫的帮助。

目前,我的代码打开了列表中的每个网页。但是,我希望从它加载的每一个中提取信息。这就是我所拥有的。

from selenium import webdriver;
import csv;

driver = webdriver.Firefox();

driver.get("https://www.betexplorer.com/baseball/usa/mlb-2018/results/? 
stage=KvfZSOKj&month=all")
links_code : list = driver.find_elements_by_xpath('//a[@class="in-match"]');
first_two : list = links_code[0:2];
first_two_links : list = [];

i : int;
for i in first_two:
    link = i.get_attribute("href");
    first_two_links.append(link);

odds : list = [];
i :int;
for i in first_two_links:
    driver.get(i);
    o = driver.find_element_by_xpath('//span[@class="table-main__detail- 
    odds--hasarchive"]');
    odds.append(o);

**Error:** NoSuchElementException: Message: Unable to locate element: 
//span[@class="table-main__detail- odds--hasarchive"]

我现在只是想抓取前两个链接,以便更容易管理。但是,我似乎无法找到解决此错误的方法。

在我看来,错误似乎表明它正在搜索主页中的 x_path,而不是它所遵循的链接。

任何帮助表示赞赏。

标签: pythonselenium

解决方案


推荐阅读