python - 如何遍历这些页面并从每个页面中抓取信息?
问题描述
我是编程新手,需要一些关于我的网络爬虫的帮助。
目前,我的代码打开了列表中的每个网页。但是,我希望从它加载的每一个中提取信息。这就是我所拥有的。
from selenium import webdriver;
import csv;
driver = webdriver.Firefox();
driver.get("https://www.betexplorer.com/baseball/usa/mlb-2018/results/?
stage=KvfZSOKj&month=all")
links_code : list = driver.find_elements_by_xpath('//a[@class="in-match"]');
first_two : list = links_code[0:2];
first_two_links : list = [];
i : int;
for i in first_two:
link = i.get_attribute("href");
first_two_links.append(link);
odds : list = [];
i :int;
for i in first_two_links:
driver.get(i);
o = driver.find_element_by_xpath('//span[@class="table-main__detail-
odds--hasarchive"]');
odds.append(o);
**Error:** NoSuchElementException: Message: Unable to locate element:
//span[@class="table-main__detail- odds--hasarchive"]
我现在只是想抓取前两个链接,以便更容易管理。但是,我似乎无法找到解决此错误的方法。
在我看来,错误似乎表明它正在搜索主页中的 x_path,而不是它所遵循的链接。
任何帮助表示赞赏。
解决方案
推荐阅读
- regex - 正则表达式提取一个字符的第二个实例和另一个字符的第二个实例之间的字符串
- javascript - 从对象数组中删除键值
- linux - 是否可以挂载 FIT 映像中包含的文件系统?
- postgresql - 尝试将列类型从文本更改为几何时出错
- xpath - Google Sheets 表格格式中的 IMPORTXML XPath 问题
- python - keras 在不同 conda 环境下的错误
- python - 将 python 代码传输到 tensorflow,而 AutoGraph 不起作用
- laravel - 如何在 Laravel WHERE 子句中使用 IN 运算符?
- c++ - 无法在 OSX 上更改 OpenGL 版本
- regex - 正则表达式,从日志中提取数据列表